预见·科技丨通用大模型“国家队”成果迭代,大模型竞争进入新维度丨封面天天见

预见·科技丨通用大模型“国家队”成果迭代,大模型竞争进入新维度丨封面天天见
2024年10月31日 23:07 封面新闻

封面新闻记者 欧阳宏宇

中国造大模型发展到怎样的程度了?在第一个款国产通用大语言模型发布的592天后,“通用大模型国家队”拍了拍GPT-4 Turbo说,“起来卷”。

近日,在第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火大模型4.0 Turbo:根据鲜活的真实数据背靠背测试,七大能力全面超过GPT-4 Turbo,数学能力、代码能力超过GPT-4o,国内外中英文14项主流测试集中9项实现超越。同时公布了10项基于该底座能力的硬核产品与创新应用。

从百度文心到阿里通义、商汤日日新、腾讯混元,再到科大讯飞此次发布的讯飞星火4.0 Turbo,中国造大模型在推出时与GPT一较高下,已是发布会上的一个保留环节。AI大模型产品背后,众多科技企业和全国重点实验室贴着OpenAI进行技术比拼,更是中国AI技术在同全球技术高地比长短、找差距中,所展现出的雄心。

更重要的是,比性能只是国产大模型参与全球竞争的第一步。当越来越多的国产大模型将其多模态能力,从剪视频、写文案、做PPT中抽离,把更多优先级植入工业场景、生活场景、家庭陪伴机器人具身智能等多个领域,已证明了拼赋能才是走向世界的关键一步棋。正如刘庆峰在演讲中所表示的,“未来AI技术的探索,必须大规模产业化,必须在场景中进入到真正的深水区,所有玩‘概念’的都不会有大未来”。

大模型加速发展

“国家队”下场加码研发

国产大模型的发展史就是一段同GPT比拼的竞争史。

自去年3月GPT-4上线后,国内科技企业纷纷跑步入场。两个月后,星火大模型1.0版本发布,当时刘庆峰放话,星火大模型要在10月份对标ChatGPT,不仅要在中文上超越,还要在英文上达到和ChatGPT一样的水平。随后才有李彦宏发布“文心大模型4.0”时称,该模型综合水平与GPT-4相比已经毫不逊色。

这也拉开了国内“百模大战”,走出去参与全球技术竞争的序幕。阿里“通义大模型”、百川智能“Baichuan 3”、零一万物“闪电”陆续对外宣称已在不同维度上超越GPT的新版本。

技术演进往往有“差异化”和“跨界”的特点,这也催生了很多创业公司在技术爆发初期能有一番作为。但AI大模型技术突破需有规模效应,“小打小闹”地搞研发是无法把技术变成生产力的。在巨头企业、头部厂商、科研院所百花齐放的序曲中,“国家队”下场加码AI研发才能将技术研发推向新高度。

2022年5月,认知智能全国重点实验室在合肥成立,是我国首批20家标杆全国重点实验室之一。据介绍,该实验室由中国科学技术大学和科大讯飞联合共建,主要围绕认知智能共性基础技术和应用关键技术开展研究,目前已产出了星火认知大模型等一系列创新成果。

在经过了多版本迭代后,讯飞星火4.0 Turbo已经在近期发布。据介绍,根据真实数据背靠背的测试,该大模型的7大能力超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o;在理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中的9项,实现了对GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro等国外三大主流模型的超越,效率相对提升50%。

“我们已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类OpenAI 01的高难度数学能力显著提升。”刘庆峰表示。

中国造大模型正以超乎想象的进化速度对全球AI技术高地发起冲击。相关技术一路狂飙,速度超过了以往任何一项技术的发展进程。

不过,和所有新技术投入的过程一样,对大模型加大研发投入也是一场烧钱的持久战,在技术智能化已达到一定程度后,如何走出“大而空、讲故事、讲情怀”的套路,真正专注于落地场景和案例,实现可持续的商业化变现。这是大模型前进的必由之路,也是厂商们下一阶段的重头戏。

突破行业瓶颈期

靠扎根产业“换道超车”

今年初,OpenAI凭借人工智能文生视频大模型Sora再次在全球范围内掀起一轮大模型热潮,也让业界看到了AI技术发展达到一定高度后,对于行业应用带来的巨大潜力。

事实上,受数据与算力的制约,在国产AI大模型发展到今天,靠继续提升其通用性能催生进步已显示出规模不经济的态势。要想实现“弯道超车”,必须“换道超车”,扎根产业场景。

“大模型的多模态理解能力比多模态生成更重要。”在刘庆峰看来,对于大模型的多模态能力,生成视频只是娱乐,更优先级的是进入工业场景、生活场景、家庭陪伴机器人等具体领域。

智能汽车被认为是智能手机后的下一个蓝海市场,也是AI众多应用场景中非常重要的一个。就在今年5月,支付宝宣布与科大讯飞达成合作,双方将在大模型、车机支付、小程序服务等领域展开合作,共建更为智能的座舱服务生态。相似的合作还有吉利和腾讯应用宝,广丰携手华为,长安之于百度,上汽联合阿里,为的是将数智化驾乘用车体验赋能到智能汽车上。

奇瑞控股集团有限公司党委书记董事长、总经理尹同跃在声博会现场接受采访时表示:“过去的21年,奇瑞汽车连续位居中国乘用车品牌出口第一名。在智能化助力中国车企‘出海’的道路上,科大讯飞一直是奇瑞最坚实的合作伙伴。”据了解,类似有智能语音交互装配的智能汽车已经超过了6000万辆。

AI上车在智慧座舱场景中的应用,不仅将推动服务从简单推荐转变为识别需求、执行需求,更能实现车载服务在交互效能层面、服务推荐层面、用户意图执行层面的全链路优化。其带来的智能驾驶的便捷性与智能性,已重新定义了人与车的关系。

除了汽车场景之外,教育、医疗、司法、政务服务、企业办公等多个民生领域和行业也已得到了AI技术的赋能。科技企业所要做的,就是用人工智能技术解决这些社会刚需。

比如在教育领域AI学习机赛道,前有精准学推出超拟人一对一AI老师技术,在讲授环节提高学习效率,而在讯飞AI学习机中首次搭载的AI作业过滤器技术,则进一步补全了练习环节。据介绍,在AI的赋能下,学习机可以通过OCR能力识别出纸质练习题,根据学生历史学习情况和本地化考情,将题目分出“必做题”“选做题”“建议不做题”三个等级,实现“练得更少、学得更好”的目标。这种教师智慧和机器智能的双向赋能,通过“人机共育”帮助学生实现知识、到能力、再到素养的综合培养,正是用AI技术解决教育行业刚需的外延之一。

专注于场景落地,在细分领域展示出旺盛的生命力,切实为企业和用户提供降本增效的方案,已经成为当下“通用大模型国家队”集中发力的点。从“做与不做”迈向“做得怎么样”,这正是大模型之争的下一步。

新技术蓬勃兴起

借应用与普惠穿越“奇点”

就在几天前,工信对外披露的新型信息基础设施建设进展数据显示,我国现有完成备案并上线为公众提供服务的生成式人工智能服务大模型近200个,注册用户超过了6亿;并且已形成了135个新型数字服务优秀案例,覆盖交通、文旅、养老、医疗、应急等领域。

不过,在人工智能等新技术蓬勃兴起背后,行业也在面对饱和与同质的问题。以至于用户经常会注意到一个现象,在手机上下载了十来个大模型App,使用下来发现难找到它们之间的技术差异。

这个现象出现的原因,在于不少大模型仍在盲目追求数据量与模型参数,却忽视了应用层的落地与积累。就像是要知道一根原木是不是可造之材,绝不仅仅是把它束之高阁,要将其打磨出来,去造桥建屋,发挥自己的价值。对于AI大模型来说也是同理,不是在发布会和测试数据里说出来的,而是在亿万用户,在千行百业手里用出来的。

可喜的是,随着新一代信息技术的发展,已经有越来越多的新技术、新产品和新服在政策的支持下开始落地应用。据工信部新闻发言人、总工程师赵志国透露,在持续推动《算力基础设施高质量发展行动计划》任务落实的背景下,已在支持部分发达地区先行先试,探索人工智能等建设和应用新模式。

在很多业内人士看来,在“大数据+大算力+强算法”增强通用性之后,人工智能已进入了以专用小模型定制训练为主的“手工作坊”,和以通用大模型预训练为主的“大型工厂”并行的时代。

此前发布的《2024-2029年中国人工智能大模型行业发展分析及发展趋势预测报告》也显示,未来大模型的发展将有三大趋势:一是通用大模型性能提升和优化进一步深入;二是大模型将从简单智能应用向复杂智能应用迈进;三是大模型超级应用将出现,提供体验感极强的智能服务。

所以,在经历了近600天的发展后,国产人工智能赛道已从“有没有大模型”,变成了“能不能做好大模型”以及“能不能用好大模型”。面对新的问题和考验,“通用大模型国家队”已经用技术积累和应用生态作出回应。

如果说在大模型元年,我们看到的是大模型的数量。那么在更远的未来,在我们所期待的AGI,已经有领先者用大模型的应用质量和普惠价值铺设了通向穿越“奇点”时刻的路。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部