专访思必驰俞凯:大模型直接作用于自动驾驶决策,可能不会那么快

专访思必驰俞凯:大模型直接作用于自动驾驶决策,可能不会那么快
2024年07月05日 17:00 中新经纬

  中新经纬7月5日电 (常涛 林琬斯)“大模型对于自动驾驶会有帮助,但直接作用于自动驾驶决策,可能不会那么快。”2024世界人工智能大会(下称大会)期间,思必驰联合创始人、首席科学家,上海交通大学教授俞凯接受中新经纬专访时表示。

  当下,汽车行业的竞争正驶向“智能化”,大模型技术也开始迅速“上车”。市场认为,大模型正在加快自动驾驶技术的演进速度,让自动驾驶大规模应用的时间早点到来。

  未来,大模型在汽车行业还有哪些想象空间?

俞凯 受访者供图

安全性和可靠性是第一位

  在俞凯看来,大模型在汽车行业中的应用方向广泛。从用户感知的角度来看,大模型“上车”两个最大的应用是自动驾驶和智能座舱多模态交互。大模型在自动驾驶领域的应用,不仅加速了自动驾驶算法的训练和优化过程,还直接参与到了决策模型的构建中,进而推动自动驾驶技术的显著发展。

  不过,俞凯分析称,现在的(大模型在自动驾驶技术上的)应用还处在相对早期阶段。思必驰的核心技术方向是人机对话交互,这里的“对话”已经是跨媒体的多重层面意义的对话,其中也包括了对汽车相关的执行和车控指令。未来是否能与自动驾驶结合,公司也在做相应的探索,但安全性和可靠性永远是第一位的。

  2023年7月,思必驰发布了针对垂域的、具有通用智能的行业语言大模型DFM-2,在汽车等垂直行业落地应用。

  不过,俞凯强调,单一的、千亿的、集中的大模型,不适合在车里接入,原因在于成本、反应速度和整体调用链路的用户体验可靠性都无法达标。

  俞凯认为,需要将大模型进行全方位升级,在整体架构上既有大模型通用理解和生成回复的优势,又有原来全链路系统的高级用户体验,快速并且准确。两者兼得,大模型才能真的在车里落地。

  据介绍,在实际应用场景中,面对不同的大模型各有所长又相互难以融合的问题,思必驰基于自研全链路智能语音语言交互技术、DFM大模型以及大数据构建了“中枢大模型”架构,打造“1+ N”模式,即“1”个百模中台(中枢大模型)与“N”个专业大模型组合上车,打通前端语言处理、用车场景与后端模型生态,形成车载垂域的生态圈,使车载AI体验从“语音指令”迈向“语言智能”+“工具智能”。

  目前,思必驰的中枢大模型方案已在北汽、哪吒等多个项目实施落地。

大模型落地:如何成为新质生产力

  本次大会期间,俞凯密切关注人工智能在推动新质生产力发展中的作用及趋势。

  “新质生产力”是2024年的高频词汇。大模型如何落地成为真正的新质生产力,这个问题成为与会者的热议话题。

  对此,俞凯表示,一方面,要关心大模型在科学智能领域中的发展,其中既包括自然科学智能,也包括社会科学智能,因为科学智能领域受到的产业数据限制较少,更容易形成闭环。

  另一方面,俞凯也提到,要对大模型本身的应用做好分工和协同,不能一味地求全求大。对此,他更关心大模型的新形态应用,怎么样把非大模型的技术与大模型进行深度结合绑定,形成可用、高效的系统。

  至今,大模型热潮涌动了一年多。今年3月,中国国家数据局局长刘烈宏在中国发展高层论坛2024年年会上透露,中国10亿参数规模以上的大模型数量已超100个,行业大模型深度赋能电子信息、医疗、交通等领域,形成上百种应用模式。

  在“大模型之争”的下半场,仍有不少创业者进入这个赛道。但在商业化落地层面始终存在巨大鸿沟。对于大模型创业者,B端和C端两种不同的路径如何选择?

  在俞凯看来,从C端还是B端切入都可以,主要还是取决于多种因素,包括市场需求、创业者的资源能力、技术成熟度等。

  “无论是选择C端还是B端,关键在于创业者找到与自身优势和市场需求最匹配的切入点。”俞凯指出。

  俞凯分析,C端市场更加活跃,用户需求也更加多样化,为大模型的应用场景带来更加丰富的想象空间。同时,C 端需要的是更快的应用落地,尤其是要把整个用户体验打穿。

  他建议创业者,要从完整的用户体验的系统角度考虑,千万不要从大模型本身的技术出发,要适当考虑产品对大模型足够的容忍。

  另外,俞凯分析,B端准入门槛相对较高,对可靠性的要求远大于对多样性的要求,所以to B要更慎重。创业者更需要了解的是业务的流程,以及在产业结合过程中,大模型所能带来的效果和成本是否合适。

  (中新经纬APP)

(文中观点仅供参考,不构成投资建议,投资有风险,入市需谨慎。)

  中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其他方式使用。

责任编辑:魏薇 罗琨

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部