李彦宏最新演讲:没有应用的大模型一文不值!

李彦宏最新演讲:没有应用的大模型一文不值!
2024年07月09日 17:26 亚布力中国企业家论坛
李彦宏 百度创始人、董事长兼首席执行官

7月4日,在2024世界人工智能大会(WAIC)产业发展主论坛中,百度创始人、董事长兼首席执行官李彦宏进行了题为“通用人工智能产业变革机遇”的演讲。

以下为演讲全文(有删改):

我认为AI的技术发展路线,发生了方向性的改变,从过去的辨别式人工智能,转向了未来的生成式人工智能。

我曾在2022年时讲过这句话,5个月后ChatGPT发布,到现在已经有两年的时间,可以说人工智能颠覆了绝大多数人的认知。

2023年,国内掀起的“百模大战”虽导致了社会资源,尤其是算力的巨大浪费,但同时也为我国追赶世界上最先进基础模型的能力奠定了基础。

2023年10月,我宣布文心4.0发布的时候讲过,文心4.0的能力跟GPT-4相比毫不逊色,好多的同行还不以为然,如今大家可以看到,国内已经有多款闭源模型声称它们已经追平或者是超越了GPT-4的水平。

注意,我们说的是闭源大模型,不是开源大模型,这也是今年以来争议比较多的一个话题。有些外行甚至混淆了模型开源和代码开源这两个概念。

所谓模型开源,往往只是提供了模型的大量参数,但想要有效应用这些模型,还需要进行后续的SFT(如软提示调优)和安全对齐工作。由于不了解这些参数的生成过程和数据源,难以直接实现“众人拾柴火焰高”的协同效应。即使获取了模型的源代码,也可能不清楚训练这些参数所使用的具体数量和比例。因此,单纯拿到这些开源资料,并不足以让人直接站在巨人的肩膀上轻松进行迭代与开发。

所以,同样参数规模下,闭源模型往往展现出比开源模型更优越的能力,若要开源的能力追平闭源模型,则通常需要更大的参数规模,进而导致推理成本显著增加,同时可能伴随反应速度的下降。

很多人选择基于开源模型进行定制,以为这样能更好地服务于他们的个性化应用需求。然而,他们可能未意识到,这样做实际上创造了一个孤立的模型版本,既无法享受到基础模型后续升级带来的优势,也难以与其他开发者共享算力资源。

当然,我也承认开源模型在某些场景下具有不可忽视的价值。例如,在学术研究领域,或者在教学领域,研究者们可能希望通过研究大模型的工作机制,尝试构建相关理论。因为大家也经常听到,我们觉得大模型能力很强,但是不知道为什么能力强,因为背后缺乏理论支持,所以研究这个东西,用开源的我觉得没问题。

但是,在大多数实际应用场景中,开源模型可能并不是最佳选择。当你处在一个激烈竞争的市场环境当中,提升业务效率和降低成本成为关键,此时商业化的闭源模型往往能提供最优的解决方案。

当然,这些都不是最重要的,没有应用,光有基础模型,不管是开源还是闭源都一文不值。

所以,我从去年下半年起便强调,大家不要“卷”模型了,要去“卷“应用。但是,我观察到很多人仍把主要的关注点放在基础模型上,沉迷跑分和刷榜,谁又超越GPT-4了,OpenAI又推出新模型等。今天这个震撼发布,明天那个史诗级更新,但是我更想问,这些模型的实际应用在哪里?谁从中获益了?

应用其实离我们并不遥远,基于基础模型的应用已经在各行各业、各个领域开始了逐步地渗透。仅两个多月前,我们就宣布文心大模型的日调用量超过了2亿次,最近,文心的日均调用量超过了5亿次!调用量的显著增长,充分说明它背后所代表的真实需求——有人正在使用它,有人真正从大模型中获益,得到了价值。

比如在快递领域,让大模型帮助处理订单,实现了“一张图、一句话寄快递”的便捷体验,不再需要其他繁琐的流程,将时间从原来的3分多钟缩短到19秒。而且,超过90%以上的售后问题也能由大模型来高效解决,这一变化带来的效率提升是非常显著的。

再比如在小说创作领域,起初我们尝试使用开源模型并取得了一定成效,但随后改用文心的轻量级模型,并通过10轮上万组数据的SFT(监督微调)和post pretrain(后续预训练),结果有了显著提升。最近,我们进一步升级到文心4.0版本,令人惊喜的是,仅凭数百条数据,文心4.0就在情节构建和逻辑连贯性方面展现出了卓越的优势。生成的内容不仅在可用率上大幅提升,优质率也远远超过了之前的轻量级模型,让网文作者们创作如虎添翼!

其实更通用的领域,比如说代码生成,文心快码这样的软件,在各个领域,也在逐步的渗透,在百度内部,我们有30%左右的代码,已经用AI生成的,代码的采用率超过了44%。

不过,我们要避免掉入“超级应用陷阱”的误区,避免将DAU(日活跃用户数)达到10亿的APP视为唯一的成功标准,这是移动互联网时代的思维逻辑。在AI时代,“超级能干”的应用,即那些能够深刻影响产业、显著提升应用场景效率的应用,其价值或许更为重大,它们所创造的整体价值远超移动互联网时代的某些“超级应用”。

随着基础模型的日益强大,开发AI应用也越来越简单了,最简单的就是智能体,这也是我们最看好的AI应用的发展方向。制作一个好的智能体通常并不需要编码,只要用人话把智能体的工作流说清楚,再配上专有的知识库,一般就是一个很有价值的智能体了。这比互联网时代制作一个网页还要简单。

未来在医疗、金融、教育、制造、交通、农业等领域,都会依据自己的场景的特点、独特经验、行业规则及数据资源等,定制化地开发出做出各种各样的智能体。将来会有数以百万量级的智能体出现,形成庞大的智能体生态。

而搜索是智能体分发的最大的入口。在刚结束的高考季中,尽管很多大模型公司热衷于展示AI写作高考作文的能力,但这一使用价值的实际性并不强,毕竟考生无法携带大模型参加高考,然而,真正的需求在于高考结束后,广大考生面临填报志愿、选择学校和专业时产生的诸多疑问。每位考生的情况都独一无二,他们针对每所大学、每个专业都有各自特定的问题。这时,一个能够针对每位考生专有问题提供回答的智能体就显得尤为重要。

在高峰时期,百度的高考智能体每天要回答超过两百万个考生的问题,我们总共只有1000万的考生,这意味着在一天内,有相当大比例的考生在利用这一智能体服务。

AI正在以前所未有的速度向各行各业渗透,很多人担心如果我们日常的工作都让AI去做了,人是不是就没有工作机会了,这种担心不是没有道理的,但是过去这段时间,我听到的担心,听到的抱怨很多,听到的建设性的意见比较少,很少有人去致力于发掘生成式AI带来的新工作机会。

我的这些话权当抛砖引玉吧,我认为,首先,在当前的浪潮中,AI更多地是在扮演辅助性角色,如同副驾驶一般,需要人类来把控方向,AI只是作为工具来提升人类的工作效率与质量,而非完全替代人类工作。它使得人们能够更高效、更精准地完成任务;另一方面,我们也目睹了全新工作机会的兴起。例如,数据标注师这一职业,近年来我们在全国20多个城市推动了数据标注中心的建立,为社会创造了大量新的就业岗位。再如提示词工程师,他们无需编程技能,但需具备强大的逻辑思维能力,通过精准的提示词来指导并优化智能体的工作流程。随着智能体应用的日益广泛,这一职业的需求也将急剧增长。这些新兴职业通常入职门槛不高,足以支撑个人及家庭的基本生活,而对于表现出色的人才,其收入潜力更是可达年薪百万级别。

自人类文明诞生以来,永不停止的创新便深植于我们的基因之中。从石器时代简陋的手斧,跨越至移动互联网时代的智能手机,再到AI时代的大模型,人类不断创造各种工具来改善生活,提高生产力。但是它们永远只是工具,只有在被人类所使用的时候才有价值。我们坚定地相信,AI不是人类的竞争对手,我们构建和应用人工智能技术,是为了满足人的需求,增强人的能力、让人类的生活更美好。

* 来源:2024世界人工智能大会(WAIC)产业发展主论坛

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部