商汤科技升级“日日新5.0”大模型

商汤科技升级“日日新5.0”大模型
2024年04月24日 17:55 媒体滚动

转自:经济日报

商汤科技日前发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova 5.0”(以下简称:“日日新5.0”)大模型体系。推动自身大模型研发的同时,商汤科技也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

商汤科技董事长兼CEO徐立表示:“商汤会持续探索大模型能力的KRE三层架构(知识—推理—执行),不断突破大模型能力边界。”

据介绍,“日日新SenseNova”大模型体系已正式推出5个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据,“日日新5.0”采用混合专家架构,推理时上下文窗口可以有效到200K左右。在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。

徐立表示,商汤科技在文生视频平台方面也取得了技术突破,未来,通过输入一段文字或一个完整的描述,就可以生成一段视频,而且人物的服饰、发型、场景都可以根据预先设定,保持视频内容的连贯性和一致性。他说,商汤科技将一直坚定向通用人工智能的目标前行,突破数据与算力的限制,引领大模型的创新与落地。(经济日报记者 李治国)

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 03-25 中瑞股份 301587 21.73
  • 新浪首页 语音播报 相关新闻 返回顶部