运营商大模型来了:电信开源12B星辰大模型 移动客服大模型可正式对外提供相关服务

运营商大模型来了:电信开源12B星辰大模型 移动客服大模型可正式对外提供相关服务
2024年04月16日 23:30 每日经济新闻

每经记者 杨卉    每经编辑 梁枭    

来自运营商的大模型正在加速进入市场。4月16日,《每日经济新闻》记者从中国电信处获悉,近日中国电信开源了12B参数规模星辰语义大模型TeleChat-12B。相较于1月开源的7B版本,内容、性能和应用等方面整体效果提升了30%。其中,多轮推理、安全问题等领域提升超40%。另外,据了解,中国电信将于年内开源千亿级参数大模型。

根据中国电信提供的信息,TeleChat-12B将7B版本1.5T训练数据提升至3T,此次开源提供基础模型以及基于相应版本的对话模型,支持传统的全量参数更新及LoRA等只更新部分参数的高效微调方法;支持Deepspeed微调、支持int8、int4量化和国产芯片训练推理。中国电信方面表示,星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景。行文写作方面,平均生成字数超过1500字,有效采纳率为85.7%。

同日,记者还从中国移动处获悉,近日,国家互联网信息办公室发布第五批境内深度合成服务算法备案信息公告,中国移动客服大模型算法通过服务提供者备案,标志着可正式对外提供生成式人工智能服务,成为央企首个全自研、全备案的行业大模型。

据中国移动方面介绍,中国移动客服大模型主要应用于面向客户的意图识别与多轮应答,是以“中国移动九天通用大模型”为底座,应用客服领域专业数据训练的客服行业专业大模型,具备百亿参数大模型的通用交互能力和覆盖中国移动全业务的专业客服能力。

去年以来,运营商切入大模型的意愿已经十分明显。中国电信就在2023年年报中表示,2024年公司将把握以人工智能为代表的新一轮科技革命和产业变革趋势;另据东湖国家自主创新示范区官方微信公众号消息,中国移动九天人工智能团队将于2024年底对标GPT-4完成多模态大模型训练,含8款子平台、287项核心算法能力、37项规模化应用,提供从智算基础设施、核心算法能力到智能化应用的全栈人工智能服务,可服务政务、工业、教育、医疗等多个领域。

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-25 欧莱新材 688530 --
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 03-25 中瑞股份 301587 21.73
  • 新浪首页 语音播报 相关新闻 返回顶部