商汤科技重启IPO,CEO徐立称人工智能模型生产成本正逐步下降,3年前是今天的300倍

商汤科技重启IPO,CEO徐立称人工智能模型生产成本正逐步下降,3年前是今天的300倍
2021年12月22日 15:31 资识

“科研创新本身是帮助我们跨过经济周期的非常好的要素和条件,纵观历史,大部分经济的非连续性跳跃都来自科研创新。”

“人工智能需要我们对技术的认知,它可以帮助我们突破下一个阶段的认知边界。”

“每个技术从开始到真正推动经济发展,都要面临至少两个阶段,第一个阶段是技术落地,第二个阶段是降低成本。”

“未来越没有定律的学科,越容易被颠覆,像制药这种原来没有定律的行业,机器能够干得很好。”

“今天人工智能模型的生产成本正逐步下降,商汤三年降低了300倍。”

以上是12月18日,商汤科技联合创始人、CEO徐立在中国行业发展高峰论坛中,围绕人工智能发展演讲时的精彩观点。

身为AI独角兽的商汤科技一直备受市场瞩目。

12月13日,商汤科技在港交所发布公告,决定延迟全球发售及上市。原因是美国商务部将其列入“非SDN中国军工复合体企业名单”,这意味着美资将无法参与商汤科技在市场中的投资交易。

12月20日,仅过去一周时间,商汤科技公告将重启IPO,发行规模和定价区间与之前保持一致。公司基石投资者发生变动,其中,中国诚通发起设立的混合所有制改革基金、国盛海外香港、上海人工智能产业股权投资基金、上汽香港未变,新引入上海徐汇资本、国泰君安、港科技园创投基金、希玛眼科、泰州文旅。

在此次会议主讲中,身为商汤科技的核心人物之一,徐立从人工智能讲到对技术的认知,以及人类历史不同阶段对认知创新的理解。

徐立表示技术是时代发展的引擎,而且产业革命分为两个阶段,“顶天立地”(技术落地)和“铺天盖地”(成本的降低)。

在技术落地后,降低成本、实现可规模化是开启一个时代的标志。在人工智能发展的过程中,超前的认知在强大算力面前是一个有待解决的问题。

商汤推出了AI大装置,徐立指出只有解决了长尾匹配的问题,才能完成价值的闭环。

聪投整理了当天的演讲实录。这是一篇知识含量满满的分享,富含哲科思维,对文科生也有点烧脑。

 产业革命的两个阶段:技术落地和降低成本 

商汤最近有一些新闻,三年前我们准备走国际化道路的时候,美国把我们列入实体清单中,我们的采购受到了影响。

上周我们在港股IPO定价的当天,美国把我们列入涉军清单当中,阻止所有的美资投资我们,导致我们现在还在处理当中,IPO可能会往后延一下。

这一切都跟我们所做的科研创新有关,科研创新本身是帮助我们跨过经济周期的非常好的要素和条件,纵观历史,大部分经济的非连续性跳跃都来自科研创新。

我们看到所有学者型的教授,或者真正从科学实验室走出来的企业,本质的意义就在于认知的领先或者是认知的差异,所以某种意义上,我们赌的是对科技技术发展判断的认知。

所以我相信未来资本循环的模式以及创新链的模式一定是协同的,而原来是细分的创新。

人工智能需要我们对技术的认知,它可以帮助我们突破下一个阶段的认知边界。

过去300年以来,每个时代背后的驱动力都是技术,技术是时代发展的引擎。

从熊彼得跳跃式的创新理论来看,可以把每一个技术细分,每一个时期都有一个非连续的点,每个技术从开始到真正推动经济发展,都要面临至少两个阶段,一个阶段是技术落地,第二个阶段是降低成本。

第一个阶段,技术在行业中落地,我称之为叫工业的红线,任何的技术如果只是技术的突破和发展,只有学术者会关注。但是过了工业红线,其实也不是真正意义上技术赋能百业的标志。

第二个阶段,是降低成本,能够大规模的机械化生产,只有把生产成本降到原来的十分之一甚至百分之一的时候,才能做到这个时代的标志。

这两个阶段中,有两个核心问题。

第一,当技术被发明的时候,大家的认知还没有起来,比如交流电刚出来的时候,大家认为它能电死牛,当时大家持有反对情绪。

甚至汽车刚出来的时候,大家认为在马路上开汽车会吓到马,所以在车前150码的地方,有人会挥红旗,以此提醒有车来了,但是当时没人能意到,当有了汽车后就不需要马了,这是认知没起来,需要长时间的教育。

第二,成本降不下来,如果成本普遍很高的话,行业没有办法发生颠覆式的变化。

 人工智能的发展,2010年是个分水岭 

人工智能就是这样子,2010年前是人工指导智能的时代因为不管是传统的、深层次的或者是差异化的形式,都非常依赖于人的先验知识,都需要人的理解。

比如数据的分布,需要很多人类的先验,才能够做预测。

人工指导的智能有很大的局限,它的上限是人,导致它没办法超越人,所以它很难形成一种大规模的行业应用。

为什么在某一个阶段突然就可以呢,是因为这波人工智能的驱动依赖于两个因素,一是大数据。

二是背后的算力给予它一个非常强大的探索空间的能力,再加上算法本身对世界有很好的呈现表达,它可以完全不依赖于人了,所以它就有可能超越人。

2013、2014年,我们看到人工智能在很多垂直领域里能够超越人,我认为可以把超越人作为超过工业红线的一个标准。

但是从第一个阶段到商用还有一定的差距,生产成本是不是过高?就像工业制造也面临同样的问题。

AlphaZero为例,确实已经超越了人,现在没有人怀疑,但是刚起来的时候,也有认知问题。

如果围棋本身是一个工种的话,假设现在我们全国的职业棋手有170多个,退休的300个,每年的成本是几千万,但是AlphaZero的成本是30亿左右,算下来可能需要70年才能回本。

如果我找到一个工厂说,我能帮你改造升级这条产线,但是你的ROI需要70年能够回本,这样的话,就不容易被投资。

在这两个因素当中,第二个因素更能促进整个行业的发展和变化,我把第一个因素称之为叫“顶天立地”,第二个叫“铺天盖地”。

 人类认知的创新经历四个范式 

我们先看看“顶天立地”的条件是什么,为什么现在我们有机会做到“顶天立地”。

人类真正意义上的认知创新有4个范式,其中一个是亚里士多德的推理演绎,欧几里德和牛顿定律都是从这条来的。

它的原理是根据一个基础的原点,往前一直推理到无穷的边界。今天所有的科技,以及西方的治理模式都是用推理演绎的来做的。

直到千年之后,培根说其实人类的创新还有一种模式叫归纳。

为什么这么长时间之后才有了经验归纳,人们才把它称之为范式,最核心的原因是以前人类不知道自己的无知,总觉得能够用一种通用的方法推导边界,直到后面发现所有的东西只能在特定的条件才能往下走,所以归纳才会成为了可能性。

2007年,图灵奖得主吉姆格雷提出人类历史上第三、第四个范式。

第三范式是计算机模拟,计算机模拟就是计算机帮你做推理演绎。

现在的天气预报,包括宇宙三体的问题,都是计算机模拟,算的准不准取决于问题本身是不是一个混沌问题,初值发生变化,后面也会变化。

用计算机做归纳叫做第四范式,是数据的密集型。

之前我问过同事,人类历史上有什么东西是只增不减的,有人说是房价,但其实是数据。

可能我们不见得那么依赖数据,但是人类真正意义上非连续的变化是天才的猜想和脑洞。

比如牛顿小时候被苹果砸到头上,爱因斯坦小时候梦到自己乘坐了一个光线等等,人类历史上的科研突破基本上都是思想实验,既没有立足的基点,也没有后面的推理。

这种突发式的思想实验到后来被验证,我称之为天才的脑洞,为什么它不能成为人类历史上的范式?因为范式是可以预测的,而这个是不能被预测的。

 未来越没有定律的学科越容易被颠覆 

图灵在1950年提了一个问题,机器会不会思考?

70年之后,我们可以问另一个问题,机器能不能做猜想?答案是肯定的。

其实有了这个变化之后,人类对世界认知的模式发生了巨大的变化,因为机器猜想这件事情是可规模可复制的。

举一个例子,AlphaZero,围棋的复杂度是10的170次方。为什么举这个例子?因为它的复杂度不是问题中最复杂的,但它足以证明这个东西是一个猜想。

围棋的复杂程度远大于宇宙中的原子个数,宇宙中的原子个数是10的70次方,如果每一个原子都是一个超级转机,每秒计算1亿亿次,那么从宇宙大爆炸开始到今天也算不完。

某种意义上,AlphaZero就是胡猜,它不是在求解,它是猜了一个让你觉得是正确的解。

AlphaZero刚出来的时候,人类也会觉得这东西不靠谱,甚至柯洁当时都说AlphaZero是不可能超越人的,但是最后它给出一个比人类解更好的猜想。

今天这个问题放在我们面前,如果计算机或者AI能够很容易地猜想出牛顿定律,而牛顿还要在200年之后才出生,我们用不用这个定律?

这里面包含两个问题,第一,首先需要知道牛顿定律在现在的环境下可以被使用的,这需要认知往前走一步,毕竟它超前的。

再举个例子,比如在亚里士多德时代,你跟他说牛顿定律,他可能还能够逐步理解,但是你要告诉他相对论,说光是会弯的,他马上会问光是什么?认知太超前了也不行。

刘慈欣的一本书叫《诗云》,讲的是一个高端的外星文明来到地球,说你们的文明太弱了,信息传输的比特率太低了,像这种文明竟然还能存在。

后来看到人类历史上有诗的存在,他们觉得非常有意思,然后他把所有的诗的格式,所有的词都填完,做成一个叫诗云的东西。

这个时候问题来了,你能写出所有的诗,最好的诗也在里头,但是你找不出什么是好的诗,今天机器能够给出一个很好的猜想,但可悲的是,人类在这个时间点上,没有办法去识别哪些猜想是真正意义上有战略价值的猜想。

但是机器给的猜想也不都是对的,猜想只能是一个猜想,因为现在有穷的计算能力没有办法给出一个确解。

所以在这个过程中,我们只能借鉴人类的发展历史,在应用中去测试边界,用这个边界回头来做规范,所以必须在创新链当中加速它的使用,它才能够真正被用好。

像数学定律里面的庞加莱猜想、费马猜想等等,机器随时可以轻轻松松猜想几十个,这是我们这代人探索未知世界的核心能力以及变化。

所以未来越没有定律的学科,越容易被颠覆,像制药这种原来没有定律的行业,机器能够干得很好。

 大数据主要靠算力驱动,商汤推出了“AI大装置” 

人类一直觉得我们对这个世界有一个很好的把控,但实际上都是在应用当中找到边界。

西方,特别是欧洲在人工智能的使用中,给出4个原则,里面最核心的原则叫做可解释性,中国也有非常多的学者提倡可解释的AI。

我认为这个原则不可行,比如人类觉得有些东西安全,并不是因为它可以被解释,而在于它在应用中的边界。

比如说飞机起飞,到今天为止,我们用流体力学、反流体力学完全没有办法解释它起飞的动力,但是有谁觉得坐飞机不安全?

还有自行车的平衡,没有办法解释自行车为什么能够做到平衡不倒,直到今天为止物理学没法解释,但是有谁觉得这个东西没法解释就不骑自行车了,没有办法解释,学者也没有办法解释。

很多人会认为大数据就是以数据驱动的,实际上最核心的一点在于算力,我们可以看到一些应用,已经不完全是数据驱动的,这也是为什么我们推动一个更大的“AI大装置”。

为什么我称之为大装置?

因为我类比的是粒子对撞机,粒子对撞机是1956年发明的,它是用随机来解决物理的定律,以此找到探索物世界的规律,其实今天的人工智能也是这样,用随机的碰撞找到定律。

有一个有意思的现象,过去十年最好的人工智能算法,对于算力的需求增长了100万倍,这里面有很多算法其实是没有用数据的。

AlphaZero就是0数据,零数据就是不需要人类的数据,因为有些细分的工业场景,比如医疗,没有这么多数据。在很多的问题当中,长尾应用都不是大数据的问题,所以这是我们接下来面临的问题。

商汤目前的算力是3.74百亿亿次的浮点运算,是全世界最大的超算中心之一,我们既做智慧城市,又做驾驶前面的感知,从来没有人把自动驾驶和智慧城市当成一件事情来做,但是很有意思的是,这两个东西看的是同一个场景,都是人、车、物、市场。

人类看一样东西都一样,比如我在一楼看一台车和二楼看这台车,我调用的肯定是同一个识别算法,为什么机器用的是两种不同的方法。其实感知本身是个静力问题,静力问题属于类别越多,越触类旁通,就代表越好。

这是第一个问题,所以这个东西解决的是巨大的跨模态的数据,解决通用性的问题和泛化的问题,我们要做的事情就是利用通用模型来推动大算力的变化。

 只有解决长尾的匹配,才能完成价值的闭环 

第二个问题是“铺天盖地”的问题,我是第一个把“长尾”用到线下应用中的。

做科学研究的都知道,自然界中很多现象都是long tail(长尾),比如说自然图像的梯度都是long tail或者heavy tial,因为尾巴很大。

互联网过往20年来最大的贡献是解决了长尾的匹配。

比如雅虎,雅虎刚开始的时候就是一个黄页,但黄页不火,因为黄页只能解决头部问题,1万个人要的东西我给你做了,但是有两个人要的东西你不做,但这就不是互联网的基础,互联网真正起来就是搜索引擎的起来解决了长尾匹配问题。

电商、广告、搜索都是,现在所有的互联网都是在解决长尾匹配的问题,但是大家认为线下跟长尾没什么关系。

但是线下应用,像城市治理,就是在完成长尾的链条,因为现在的瓶颈是人,如果人做10个事情,你只解决其中8个瓶颈,这样是不行的,只有把所有的事情全部解决了,你才能够提升效率。

城市治理也一样,比如说城市治理,人群的问题、车的问题等等,只有把整个问题全部解决之后,才会形成一个长尾价值的闭环,实际上目前的技术是可行的。

我觉得人工智能是可以给这个世界提供一个超强的,我们称之为“基础设施”。

因为每个人一天遇到600件物品,如果有3400万个AI模型,就可以在真实世界中形成互联网。

那么在这上面可以做所有的应用,包括机械制造的应用,无人驾驶的应用都可以。

我们现在也只能做到22,000个AI模型,和3000多万个天差地别。所以这也是今天不能做全面数字化转型的一个核心,你的东西还没有结构化,所以没东西可以搜索。

但是只有把长尾这些东西都做了,价值闭环才能起来。

 把方块字带到国外,改变科技行业的认知 

所有时代背后都是技术,比如蒸汽、电气,甚至石器、铁器时代,再到信息时代都是技术,为什么技术是改变政治、经济、文化背后的驱动力,带来生产力跳跃式的变化。

但是也有些技术没有用来命名时代,我读书的时候,我记得校长说21世纪是生命科学的世纪,因为那个时候克隆羊非常火,但是为什么克隆技术没有成为时代的标识。

克隆技术不是不重要,因为它没有改变我们生产要素的价格,为什么人工智能有机会成为我们这个时代的标识,因为人工智能够降低这个时代生产要素的价格。

有本书叫《prediction machines》,当某种基础产品的价格大幅下降的时候,我定义的大幅下降是100倍,整个世界都会发生变化。

今天人工智能模型的生产成本在下降,商汤3年降低了300倍,今天正处于从“顶天立地”到“铺天盖地”,而且只有做到铺天盖地,人工智能才能变成一个时代的“基础设施”。

最后讲讲商汤,我们当时设计Logo的时候,设计师一直跟我们说,你们是一个比较国际化的企业,出海的时候最好换一个Logo,只有英文或者只有Logo。

但我就问了一个问题,为什么中文字不能做出海代表,他说中文字跟科技连不起来,而且存在一些其他问题,我说这是现状发展中的过程,这不就是一代人的认知吗?

如果没有一个人能够跳出来去改变这个认知,那么中国的方块字和科技永远连不起来,我就要做方块字跟科技联系起来的第一代人,所以我们就带着方块字出海,而且方块字巨大无比。

我希望通过我们这一代人,可以把高科技跟我们的方块字联系起来,改变一些行业的认知。

编辑:慧羊羊

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部