“日日新”再上新 争当全能“学霸”

“日日新”再上新 争当全能“学霸”
2024年04月24日 14:50 新民晚报

“日日新5.0”在应用产品层面已支持高清长图的解析、理解以及文生图交互式生成,图中画面为商汤秒画AI生成 本报记者 陈炅玮 摄

昨天,商汤科技举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求。同时,“日日新”大模型体系升级至5.0版本,综合能力全面对标GPT-4 Turbo。

商汤科技董事长兼CEO徐立表示,在人工智能发展的最基本法则——尺度定律的准则下,商汤持续寻求最优数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

“文理双修”能力大提升

自去年4月问世以来,“日日新”大模型体系已推出五个大版本迭代。徐立介绍,“日日新5.0”的更新,主要增强了知识、数学、推理及代码能力,全面对标GPT-4Turbo,主流客观评测上达到或超越GPT-4 Turbo。

升级后的“日日新”是不偏科的“学霸”——文科能力方面,“日日新5.0”的创意写作能力、推理能力、总结能力均大幅提升。相同的中文知识注入后,可以获得更好的理解、总结及问答,有望为教育、内容产业等垂直应用场景提供有力辅助;理科能力方面,“日日新5.0”的数理能力、代码能力及推理能力达到业内领先水平,或为金融、数据分析等场景落地提供坚实基础。

“‘日日新5.0’的另一大核心突破,是多模态能力。”徐立表示,“其图文感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位。”

值得一提的是,“日日新5.0”在应用产品层面也实现了多模态能力:支持高清长图的解析和理解及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示。

完成“云、端、边”全栈布局

“我们观察到了中心化算力需求向端侧扩展的未来趋势,以及企业在边缘侧的AI需求。”徐立指出。此次,商汤于业内首次推出“云、端、边”全栈大模型产品矩阵,包括应用于终端设备的“端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“企业级大模型一体机”。

据介绍,日日新·端侧大模型性能实现同等尺度最优,跨级尺度全面领先。“端侧大语言模型实现了业内最快的推理速度。”徐立介绍,人眼最快阅读速度是20字/秒,端侧大语言模型可在中端平台实现18.3字/秒的平均生成速度,旗舰平台更是达到了78.3字/秒。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤在技术交流日上推出了企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

“文生视频”已在路上

在技术交流日最后环节,徐立带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。

记者获悉,商汤科技在文生视频平台方面已取得了技术突破。未来,用户通过输入一段文字或一个完整的描述,就可生成一段视频,而且人物的服饰、发型、场景都可根据要求预先设定,以保持视频内容的连贯性和一致性。

“一方面,现阶段大模型发展已进入落地阶段,如何与产业、应用场景结合是关键一环。”徐立分析,“另一方面,‘尺度定律’路径逐渐清晰,‘涌现’时刻不断出现,前瞻探索最先进的大模型技术亦是重中之重。”本报记者 郜阳

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 03-25 中瑞股份 301587 21.73
  • 新浪首页 语音播报 相关新闻 返回顶部