周鸿祎谈大模型:六大判断 四个方向 两条战线

周鸿祎谈大模型:六大判断 四个方向 两条战线
2024年06月25日 16:35 长江商学院

2024年,全球人工智能产业迎来了一系列重大事件,SORA的崛起、Llama3的开源等技术成果层出不穷,“大模型”也开始进入人们的视野,乘上了发展东风,迅速成为科技圈的新宠。

科技浪潮奔涌而来,企业应该如何应对?AI科技如何驱动未来发展?5月在深圳举行的2024长江独角兽峰会邀请到360集团创始人、长江商学院CEO8期校友周鸿祎做闭幕演讲。在演讲中, 周鸿祎提出:大模型作为工业革命级的生产力工具,将引领新一轮工业革命。要想通过大模型掀起工业革命,就需要把它“拉下神坛”,让它走进千家万户、百行千业。

以下为周鸿祎在2024长江独角兽峰会上的演讲精编,一起来看看他对大模型发展趋势及中国大模型发展路径的思考。

分享 | 周鸿祎

360集团创始人、长江商学院CEO8期校友周鸿祎

在2024长江独角兽峰会做闭幕演讲

大模型作为工业革命级的生产力工具,将引领未来的工业变革。

今年1月我参加了长江EMBA至诚讲坛的活动,与大家分享了大模型时代企业如何拥抱人工智能的话题。过去三个月,全球人工智能产业又发生了很多大事件,在技术创新、产品落地、开源建设等领域全面开花,SORA横空出世、Llama3开源......由科技进步带来的度日如年的感受依然在继续,我们正处在一场史无前例的科技变革当中。

2024长江独角兽峰会的主题——“AI驱动的未来”,让我眼前一亮。大模型出现后,我有一个明确的观点:大模型作为工业革命级的生产力工具,将引领新一轮工业革命。

AI信仰与All in AI

最近半年我去了两次美国,深切地感受到美国科技界对于AI的投入和狂热。他们将AI视作再次实现产业升级的机会,所有的创业者都在围绕AI做创新,投资者也锁定了AI项目。

面对摧枯拉朽的AI浪潮,我提出两个概念:“AI信仰”和“All In AI”。

大模型在中国真正推动起来,首先要解决认知问题,即所谓的“AI信仰”。我先提出六个判断:

大模型是真智能;

AGI(通用人工智能)正在加速到来;

大模型会带来一场工业革命;

大模型会重塑所有产品、业务和流程;

目前有一种制造焦虑的声音,认为大模型会代替很多人的岗位。我对此则很乐观:大模型是人类发明的最好的生产力工具,会大大提高企业和个人的组织能力;

不拥抱大模型的人和公司将会被时代淘汰。

如果你认同我的这六个判断,我们再来讨论企业如何All in AI。

Think Different:

中国大模型发展应另辟蹊径

目前,在全球范围内,大模型发展的其中一条路是越做越大——也就是OpenAI的道路,不断地堆参数、堆数据、堆算力,试图做出一个全球超级人工智能,并希望全球所有公司与个人都使用它的产品。

中国也要打造自己的通用大模型,这需要政府参与指导、鼓励民间开源、开放、共享的理念,组织开源社区,让更多的公司和个体参与进来,共同推动技术的进步,实现产业跨越式发展。

但正如苹果公司的Slogan“Think Different”,大模型发展并不只有这一条路,除了越做越大,还应该越做越小,越做越专。

我们不该被OpenAI牵着鼻子走,更应该开辟第二战线,发展专业能力的企业场景大模型。

要想通过大模型掀起工业革命,就需要把它“拉下神坛”,让它走进千家万户、百行千业。

当年超级电脑发明后,只有极少数单位使用,并未带来工业革命。真正带来信息革命的是个人电脑,当它走进千家万户、百行千业时,才实现了信息技术的真正普及,带来了新一轮工业革命。

把模型不断做大,参数规模将是千亿、万亿、十万亿级。如果跟随OpenAI的路,我们在算法、算力、数据、能源、人才方面会面临很大的挑战。

首先是「武器」不足。中国很多公司拥有的显卡加起来还不如美国一家巨头公司;

其次是知识不足。中国互联网的中文数据的规模和质量正在下降,在严重“APP化”的移动互联网上,很难获取到完整的知识和数据。即使是OpeneAI,也同样面临知识不足的问题。

然而,如果我们坚定地走企业级专业大模型道路,这些问题就不再是问题。

走“窄路”:专业大模型,

解决特定场景下的专门问题

首先要建立一个认知:一个大模型无法解决企业所有问题。

在真实的场景里,没有一套软件既能管理员工,又能管理生产、财务以及客户。未来一定是一个大模型解决一个场景的垂直问题,在企业内组合多个大模型协同工作。

以专业大模型的思路,许多问题都将迎刃而解:

第一,参数量级大大下降。专业大模型只需专注解决企业在特定场景下的一个专门问题,不需要它同时能够写诗或解奥数题,那么训练一个专业大模型不再需要千亿、万亿的参数,百亿甚至几十亿的参数就够用了。

第二,研发成本降低。参数量级下降,对算力的要求也将相应降低,企业无需投入千万、上亿资金,百万或几十万资金就可以训练自己的大模型。成本缩小了上百倍,中小企业也能很快上手。

第三,术业有专攻。专业大模型不需要GPT4面面俱到的全方位能力,开源模型达到GPT3.5的能力就够用。目前,国产大模型基本都达到了这一水平。

第四,企业无需从头开始训练开源的大模型,只需进行微调,不用重复发明轮子。这对企业的AI人才的要求也会相应降低。

总的说来,专业大模型大大降低了企业应用大模型的门槛,算法、算力、成本、能源都不再是问题。

找准明星场景:

发挥专业大模型的潜力

那么,核心问题是什么?

是要找到适合大模型发挥价值的明星场景。

所谓“明星场景”,可以化繁为简地概括为:

在企业内部,往上看领导使用的场景,往下看员工的使用场景,往内看企业内部管理业务流程,往外看对外提供的产品和服务。

在这四个方向上,能否找到一个场景,在大模型应用之后提高识别的效率,提高识别的用户体验,降低识别的人力,或降低识别的成本,从而真正打动企业客户。

四个方向之外,企业寻找场景时还有一个思路:将场景细化。

企业不要先做大模型再找场景,这叫“拿着榔头找钉子”;而要先找到“明星场景”,根据场景需要设计功能,再根据功能需求来训练专有大模型。

以360为例,我们打造的“360安全大模型”是行业内首个安全大模型。

针对网络安全发现攻击难、溯源难、处置耗费人力高、漏洞发现难、大模型自身安全漏洞等安全行业的普遍问题,我们利用专家协同架构开发了安全分析、威胁溯源、响应处置、代码漏洞、安全知识问答、大模型内容安全6个大模型。目前,360安全大模型在安全专业能力上可以做到领先GPT4。

需要强调的是,专有大模型的能力不比通用大模型逊色,并非退而求其次的选择。时间将会证明,用百亿或不到百亿的大模型做垂直训练,只需选好场景、用好企业专有知识,它的专业能力可以超过GPT。

文中图片来自图虫创意,转载需获授权。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部