人工智能真那么厉害?可能是你想太多!

人工智能真那么厉害?可能是你想太多!
2017年12月27日 17:20 全景财经

作者:张浩瀚

来源:全景网

人工智能产业链,可以说自上世纪60年代以来是经历着“10年繁荣,20年萧条”(语出现任微软亚洲研究院院长洪小文)的艰难循环。从一开始的逻辑推理到专家系统,再到80年代后期酝酿转型的统计方法论,再到当下大红大紫的深度学习,人工智能仿佛一个任人打扮的小姑娘,每隔十年就会变一个样子,有了新突破后就站在台前一边接受金主们的疯狂追求,又一边被媒体妖魔化为抢夺人类工作饭碗甚至毁灭人类的末日技术。

但是在学界和科技界眼里的AI,却一直都是一个不温不火的甚至还有点让人却步的领域,原因无他,正是在这个领域的庞杂、跨界和主流技术的不断演变。准确来说,如今让我们战战兢兢准备交出饭碗的人工智能,或者用专业的术语说,深度学习,只是庞大的人工智能科学版图里的一个细分理论方向(星星之火起于1980年代,当时的领头学术大佬Geoffrey Hinton在学界被嘲笑简直家常便饭)。而之所以这么一个细分领域在近年大红大紫,在于梯度优化算法(如BP算法)的突破以及硬件性能的跃进式提升(CPU, GPU及内存)支撑。

人工智能学术界的带头大佬,多伦多大学教授Geoffrey Hinton,最新成果Capsule Networks的相关论文即将重磅发表,是一项可以大幅提升现有的卷积神经网络(CNN)各向指标的全新革命性研究(图片来源:搜狐科技)

生活化的类比:教育机器不比养娃省心

用人话说,DNN和机器学习的长足进步是怎么来的呢?如今的投资界,都喜欢开口大数据,闭口云计算。我们把计算机比作一个孩子的话,那么科学家(或工程师)就像这机器的爹妈,他们通过努力的寻求最好的教育方法(算法模型)来让孩子尽可能快的掌握知识。

教育方法来说,DNN如今运用的主要就是简单粗暴的BP算法。如何简单粗暴呢?只需要海量数据的输入即可,数据量越庞大模型的精准度和鲁棒性都会越高,就像我们的填鸭式应试教育,死记硬背能力超强也可以上北大清华。那知识怎么来的呢?知识就来自于大数据的深度分析和处理,用于训练的数据可达billion级别甚至更高。所以你看现在最顶尖的人工智能应用,就像一个班里成绩最拔尖的那几个孩子,背后都是和爹妈们付出的努力(或者血汗?)成正比的。

腾讯AI的研究与应用领域示意图(图片来源:腾讯AI Lab官网)

那爹妈们到底要多努力呢?笔者在腾讯AI部门的小伙伴说,100G左右的数据集,各种优化和训练下来也需要超过半个月时间。BAT的AI是引领中国的第一梯队,但是100G的数据集一个人要半个月时间才能优化好。100G相当于什么,相当于你家电脑1T硬盘容量十分之一的数据量。半个月一个孩子能学两三个章节的语数外已经是很不错了,100G基本上也就是这种分量。商汤科技和FACE++这种人脸识别领域的独角兽企业,要做到极高准确率的脸部识别,这个训练和数据的投入是什么量级,各位看官可以自行想象。

现在我们来抛开爹妈带娃这个比喻,来看看现实中的DNN跟人类的区别。DNN的最大优点就是简单粗暴,只要数据庞大算力强大,它就可以通过不断的优化训练做到某个细分框架内的应用做到极致,比如我们国内的人脸识别和语音识别,比如美国可以打遍天下无敌手的阿法狗和陪你扯淡的Siri(当然我相信也没人想到找Siri扯淡)。当然如果瓶颈出现的BP算法理论得到了优化甚至乎革命性的颠覆(这个应该可以拿下菲尔兹奖或者图灵奖?),深度学习的应用前景会更加乐观。不过当然,作为一项1960年代就开始了的理论研究,AI可远远不止DNN,AI的未来也必定不只有DNN,这个是每一个学科大神都会告诉你的一句话。

AI产业漫谈

好,扯了这么多的基本知识,现在就我的理解来聊聊AI这个产业。如今所谓的AI产业,应该仅被视为DNN这个方向发展所延伸出来的产业。未来如果其他方向的AI理论获得突破(如逻辑推理这个“老古董”)并进入应用场景甚至商业化阶段,则AI产业的内涵也应该相应的升华。

在DNN得到飞跃性发展的这些年之前,AI产业基本上就是个可有可无的名词,按照微软亚洲研究院院长洪小文说的,一开始的AI产品只能解决“toy domain”(玩具级)的问题,玩具级的技术应用只能停于学术层面及小规模商业应用,自然谈不上产业。深度神经网络发展起来之后,目前的AI产业链也开始初步成型,分为基础层、技术层以及应用层。

AI产业链分层图(图片来源:WPR世博资讯公众号)

基础层方面包括基础硬件,主要为传感器、处理器或芯片。全球视角来看这方面主要玩家为英伟达和谷歌,分别拥有自主的GPU芯片和ASIC全定制化芯片。这一方面为中国的弱项,据腾讯研究员2017年的人工智能报告,中国人工智能基础层企业数量仅为14家。目前有关注A股人工智能的投资者也知道,国家在半导体产业方面拟定了顶层战略并投入了大量的资源和资金对半导体企业的研发进行直接的支持,如今在存储器领域我们已经获得了大量实质性进展,AI领域芯片的突破也将可期。目前在终端芯片方面,最大的突破来自于华为最新推出的麒麟970芯片。

第二层是技术层,中国在这一层部分有一定的优势,当中有计算机视觉、语音识别、图像处理及计算机视觉等。

最后一层是应用层,这一块也是我国AI产业中相较美国而言特色较大的部分。应用层除了上述提到的企业根据自身技术形成多品类的终端产品解决方案之外,还可以集成到多项AI产品中,例如工业机器人、家用机器人、智能无人机、自动驾驶辅助系统ADAS、金融系统的风控模型和安全认证、以及多语种语音翻译机等等。

神化or妖魔化?

控制好技术不被滥用才是王道!

说到公众认知甚至投资界对AI的认知,就不能不提一下媒体层面对AI设想的各种狂欢。这种狂欢里面,声音最大的有两种,一种是神化AI(嗯,电影科幻小说看多了),一种是妖魔化。神化抑或是妖魔化,无非是受数不清的好莱坞科幻电影或者传媒作品的影响,见惯不怪。

科技界方面,则有所谓的支持AI及反对AI的两大阵营,所谓的支持方包括扎克伯格、李开复等,而所谓的反对方包括大名鼎鼎的科学家史蒂芬·霍金和马斯克,但是如果细看他们公开发表的文章或者发言之中细看,你就会发现用简单的“支持”或“反对”去把他们划归两个阵营的方式很有问题。

Space X及特斯拉汽车创始人埃隆·马斯克(图片来源:凤凰科技)

支持他们的论调就不说了,因为他们都是看到了AI技术革命带来的机会。我们来看看所谓的反方。无论是霍金和马斯克,他们都并没有以卫道士的姿态去号召科技界停止在人工智能技术方面的研究和开发;另外,他们也并没有尝试去让人们不要使用有涉及人工智能技术的产品。他们的发言,更多的是通过警告和对潜在负面影响的预测,来提醒全人类注意防范这种新技术被误用或别有用心的利用所带来的灾难性后果,从而促使社会各界更早的去设置合理的机制,预防负面因素,控制好这项技术只为人类的共同福祉服务。

当然这一方面的议题,早在2014年的联合国大会上就有杀人机器人是否应该被禁止的议题被加以讨论,而最终能否被禁止,相信在不久的未来就会有定夺。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部