近日,在2023亚布力中国企业家论坛年会【闭幕论坛】上,微软(中国)有限公司首席技术官韦青,北京中科深智科技有限公司CEO成维忠,达观数据创始人兼董事长、CEO陈运文,彩云科技创始人&CEO袁行远,一起深度探讨ChatGPT未来的挑战与机遇。中国科学技术大学科技商学院执行院长叶强主持了本场论坛。
以下为对话内容:
叶强:各位嘉宾能否在通俗的语境下,说说你们对ChatGPT的认识。
韦青:大家千万别因为新技术一出现,就觉得无所适从。我们要积极探索,共同摸出这头“大象”到底长什么样子。建议大家不要专注在ChatGPT的名词上,这只是一个做出来的Demo,它真正的底层逻辑是被称之为Large language model的大语言模型。你可以将它理解成针对人类历史上所有发生的行为、现象、知识的提炼机或蒸馏机。
举例来说,如果你家的花园里种的是狗尾巴草,它蒸出来的就是狗尾巴草油;如果是茉莉花,蒸出来就是茉莉花油;如果全是玫瑰,蒸出来就是玫瑰花油。我们可以把它抽象成“人对世界”的关系,而这种关系中间靠“知识”来衔接。只有了解这些,我们才能真正理解,为什么这可能是新一轮的文艺复兴。
成维忠:我认为,GPT-4已经是一个思维模型,而并非一个大语言模型。这是通用人工智能的一个大突破,无论是ChatGPT还是GPT-4,我们都要深度学习和积极拥抱。如果单纯从大语言模型来看它,就会产生很多认知偏差和误判。
现在新的工业革命已经开始了,ChatGPT尤其是刚出来的GPT-4相当于历史上的蒸汽机。这是一个新时代,而这个时代可能会影响未来20年甚至更长时间。
陈运文:ChatGPT火了以后,每个人都能用它进行对话和聊天。企业中各种财务、人事、合同、订单、报销、报告、投标等日常白领的工作,未来都可以由专属企业自己的大语言模型系统去完成。这个大语言系统可以学习企业每个员工日常工作的规则和行业知识,最终能自动化地完成上述工作。
达观数据正在致力于开发专业化的、垂直化的、国产的GPT模型。在接下来的2-10年,希望通过我们大语言模型的助力,再造中国商业生态,让企业效率和成本大幅降低,让中国的企业能在全球的竞争中,获得更强劲的竞争优势。
袁行远:前阵子,我用GPT-4去做北京2022年的高考语文,它的有些能力非常惊人,它能理解题目中复杂的指代关系,最终得到正确答案。经过我们的测算,它的语文试卷能得128分左右,在高考总分750分的情况下,如果每个科目它都能达到这个水平,那它的高考大约能考个630分。
这相当于“一个具有大学生智力水平的人” ,这个“人”还是可编程的,你可以跟它进行互动,可以把你的问题抛给它,它进行解决后再返回来。但它和普通大学生有两个不同:一是它知道世界上几乎所有的语言;二是它几乎知道所有的领域。可以理解为,你有一个几乎知晓所有领域的知识且可编程的“个人智能助理”。
叶强:最近有几位做NLP(自然语言处理)领域的学者跟我说,ChatGPT的表现实在太惊艳,这让他们感到不太自信。你们业界对此是什么感觉,还自信吗?ChatGPT的出现,对你们来说,是威胁更多还是机遇更多?
袁行远:突然发现行业里有个人专业做得特别好,一开始当然压力倍增。这种感觉就像自己喜欢的女生最后跟别人结婚了。自己喜欢的这个女生,就是通用人工智能,她跟别人结婚,而你没有追到她。
但从另一方面看,它也告诉我们,新大陆是存在的。这年头最重要、最困难的问题,其实不是怎么到达新大陆,而是有没有新大陆。现在有人告诉你,新大陆是有的,那你应该非常兴奋才对。而且这扇门刚刚被打开一个缝隙,你应当非常有干劲,并且朝着未来继续努力。
不能因为别人引爆了原子弹,我们就坐以待毙。我们应该奋起直追,至于能不能做到,可能没有那么重要,但首先你得相信,得开始干,这才重要。
陈运文:大语言模型GPT的参数规模大到一定程度后,都是上千亿神经元的参数规模,而我们人脑总的神经元数量也才140亿个。今天我们训练的大语言模型都是1700亿甚至两三千亿的参数规模,它的容量大约是人脑的10倍以上。
以前任何人工智能系统还从来没有训练过这么大规模的参数量,当它的参数规模突破一个临界点时,会出现一种智慧的“涌现”现象,这个人工智能系统的能力就会有一个质的飞跃。
过去训练一个人工智能系统,要花费很大的精力去给计算机标大量的数据,做大量模型的调参等,才能让计算机勉强达到一个人类白领的工作能力,但现在拥有具备“涌现”能力的人工智能系统后,它立刻就会举一反三、触类旁通,它学习新的工作岗位技能的能力前所未有,未来这个技术可以用在各行各业各岗位。这是一件对未来的10-20年都非常有影响力的事情。
虽然我们国内的国产大语言模型整体还是落后国外1-2年时间,但我们还在紧密追赶。我们跟别人差距没那么大,中国的国产大模型一定会做出来,而且一定会能发挥很大的价值。
成维忠:人机交互的历史主要有三个阶段:第一个阶段是文字用户界面(CUI);第二阶段是图形用户界面(GUI);ChatGPT和GPT-4发展以后,就到了第三个阶段“自然用户界面(NUI)”。但GPT-4这种大语言模型,和我们真实的人和人之间的交流,还有较大差异。人和人之间交流主要依靠视觉,而视觉占人类交流的80%多。ChatGPT和GPT-4现在还做不到视觉交流,需要它们跟生成式AI虚拟人相结合,实现人和“人”的交流。
与国外相比,国内的大语言模型还有差距。国内刚出来的新模型我们都测过,国内在文本生成方面,赶超国外的步伐很快,但在文生图等多模态的理解上,差距还非常大。这个差距能不能在短期里弥补上,现在还不知道。也许会像前面几位老总讲的,一两年的差距,甚至更长时间,但我们行业迭代速度很快,1—2年的时间其实差距已经很巨大。
此外,现在大家还把GPT-4和ChatGPT看成是大语言模型,这也是有问题的,它正在往多模态的思维模型的方向去发展,不仅仅是个大语言模型。我们要站在更加开阔的全球视野上,打开心胸积极学习和拥抱世界的最先进的技术和方法。
韦青:判断新事物发生的脉络,首先要察其言、观其行、审其因、辩其果。 “草蛇灰线,伏脉千里”是有脉络的。我们要警惕的是,是否还在用前一时代的思维方式,去想下一时代的问题。
世界变了,整个知识体系、思维体系都变了。我们很多人还不理解信息时代是怎么回事,语言如何表征我们的思想,行动如何表征这个世界?这方面我们的研究还是很弱的。
我自己是随着中国改革开放起来那一代,那时的一个原生逻辑是“做”,但“做”又不能不去“想”,而“想”和“学”,在这个时代是经常缺失的。我们以为在“想”,却是基于旧范式在“想”,那怎么基于新范式?
无论一个模型有多牛,回到第一性原理,它都有脉络和体系。确定了脉络之后,我们就会更加清晰。很多时候大家不太明白什么是新范式,很多文章把“机器”神话或妖魔化,但很难把“机器”回归本原。机器是机器,人是人,如果把人活成了机器或者把机器弄成了人,那一定会出问题。
很多语言对我们潜意识造成了误导。Robot在英文中就是代表一种“自动机”的含义,但在我们的语言中被翻译成了“机器人”。为什么要把一个自动机翻译成一个机器人?这种过早丧失人的主观能动性的物化,到底是把机器抬太高了,还是把人压成了机器?
总之,一定要反思,我们的每一个念头是不是有偏差。信心肯定要有,但成功不是来源于信心,而是来源于我们自己的改变和努力。
叶强:ChatGPT在哪些方面体现了它非常牛?它还有哪些地方还比较弱?大家能否举两个例子具体说说。
成维忠:企业过去做的关于“流程”方面的工作,而大多数流程的设计是为了让机器更好去理解人的意图和需求,现在要重新去认知它的合理性和价值。
这次微软的Copilot出来以后,通过GPT可以很简单地让机器知道我们要它去干什么。举个例子,原来我要三步才能完成购物,现在我旁边有一个小秘书,我直接让他帮我买一瓶水,他就帮我干完了,GPT就是这个小秘书。过去我们不知道怎么让机器理解人类,现在机器理解人的能力变高了,所以它能够干的事儿就非常多。
这对每一个企业都会产生巨大的冲击,要积极拥抱它。原来我们公司的流程也很复杂,通过不同业务流程去管理各项工作。同时,我们还有跟流程配套的资源库、知识库、图片库,等等,这些都是我们的财富和优势。但有了这种文字自动生成图片的技术以后,我们的机器能自动生成各种需要的内容,库的价值就大幅下降了。同时,机器更理解人了,“流程”也可以大幅简化。原来很有价值的业务流程和各类资源库,现在很有可能是没价值的。
陈运文:关于“流程”,我也补充一点。达观数据专门给企业提供定制化的大语言模型,用机器人帮公司完成自动化的审批工作,在这之前,我们有大量的流程可能要层层审批,但有了大语言模型以后,一个机器人可以快速且客观公正地帮你完成很多事项的自动化审批工作,能够大幅提高工作效率。
但它当前的缺点是对一些特别具体数字类的文字推演、分析方面的能力,还是有短板。比如,让它做一个“鸡兔同笼”的问题,它还是做不好的,尽管做不好,但它会给你讲得头头是道,最后给你一个错误的答案。所以在涉及特别精密数字的运算推理领域,我们还是需要叠加一些有监督的专用技术,才能弥补当前的短板。我们在用它做精确数字混合运算时,还是需要保持警惕。
袁行远:我举两个例子。有个高考语文题:
“核酸检测排队时需要两米安全距离,一些社区为两米间隔线设置了安全贴心、形式多样的标志,有的是撑起的晴雨伞,有的是贴在地上的古诗词图片。请选择一个检测点,依据其环境特点,设计两米间隔线标志,并写出设计理由。”
ChatGPT针对这个问题,给出了一个答案:
“可以选择一个公园设计成核酸检测点,在地上贴上公园里的植物介绍,这样大家可以一边等待检测,一边看植物介绍。”
还有一个用户案例:
最近某天深夜,我老婆突然肚子不舒服,我把这个情况告诉了GPT-4,它很快给出了几种可能,我按照它分析的可能性去做,后面果然也没什么问题。我对孕妇相关的事一窍不通,它却能给到我一些看起来还可以的建议。这给了我很大的震撼。不过语言模型的弱点就是,它与现实世界、物理世界交互之后,还是会经常出各种错。
韦青:人是不是用“概率”思维,我们还要去研究,但机器是用“概率”思维,它是以概率的方式理解我们的,懂得的是概率推理,而不懂得概念推理。机器擅长记忆,它的这种记忆表现方式目前来看是静态的、平的,所以它在连续对话时有可能就会犯错,因为它没有过去时间轴、单向轴的这种方向的记忆。
总的来说,一是概率,二是记忆,三是时间和空间。这几个关键词理解完之后,人才能认识这个工具。比如,你发明了一把枪,没见过枪的土著会怎么用这把枪?你给了他一把枪,结果没有打到野兽。到底是因为这把枪不好,还是由于他不懂什么是枪而把它当成打狗棍来用了?这是一个问题。最重要的还是得去试用。
叶强:由于时间关系,最后再问两个问题:一是从管理角度看,我们的技术创新会发生哪些变化,企业要做哪些管理创新?第二,对人才的培养,各位有什么见解?你们可以挑一个问题来回答。
陈运文:从管理的角度来说,这次大语言模型有一个特别大的特征就是典型的厚积薄发。它把人类历史上所有的教科书、论文、报告、资料都沉淀下来,积累了巨大规模的参数量,在六七年的时间里投了无数的资金,而且一分钱不挣。OpenAI走的这条技术道路原本学术界并不太看好,因为这条路大家都觉得特别费时费力,吃力不讨好,还都感觉好像走不通,但OpenAI能够坚持下来,积累这么多,最终登顶,这非常了不起。
很多时候,我们的科技创新要有耐心,也需要有厚积薄发的精神。有时大家太过于急功近利,一个技术还没有成熟就立刻想着怎么变现挣钱,或者遇到困难就半途而废,这很难真正做出巨大的创新成果。希望未来大家能更加脚踏实地地积累更多的数据,打磨好更多的模型,扎扎实实地把技术做出来之后,再在各行各业应用。
成维忠:这次OpenAI的成功,与企业家精神有非常大的关系。我干的这个行业做的是多模态大模型,我的合伙人是我的中科大同学,但我俩一不是美国名校博士,二不是教授,经常会有人问,你们为什么会干这个事儿?你们能干得出来吗?你们是从美国回国的教授吗?这些质疑其实是有问题的,OpenAI的CEO连大学都没有读完,他们能成功,企业家的使命感和执着探索的精神在其中发挥了主要作用。
所以我们不在乎被质疑,一直在干。支撑我们坚守的核心,就是企业家精神,就是干自己相信的、喜欢的事。
韦青:经常听到有这种说法:大学是培养“会思考的人”的大学,不应该只是培养“学位”的大学。这话说得很容易,但在中国推行起来很难。我就想给各位企业家们提个建议,企业在招人时,如果不是以最后“会用和会思考”的标准来招聘,那么这种社会风气还是改不掉的,建议应聘的方式尽量选择一种实操型的方式,而不是只看学历和证书。
袁行远:如果有机会,希望管理学能去研究一下ChatGPT这种类似的技术,以帮助我们进行管理。是不是将来包括OKR、年度报表等在相关的绩效考核,可以丢给机器去做?希望新技术能帮助企业找出更多问题,发现更适合的人才,增强管理的团队建设,以及带来新的管理体验。
责编|许加林
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有