打游戏就能得到数据,人工智能正稳步掌握虚拟世界

打游戏就能得到数据,人工智能正稳步掌握虚拟世界
2017年04月23日 20:25 商业周刊

撰文:Jeremy Kahn

人工智能系统正在稳步掌控更复杂的虚拟世界

“通过游戏,想要多少数据就可以生成多少”

自IBM的超级电脑“深蓝”(DeepBlue)在六局对抗赛中击败国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)之后的20年来,甚至自IBM的另一台超级电脑“沃森”(Watson)在美国最受欢迎的智力竞赛节目《危险边缘》(Jeopardy)中打败连胜74场的软件工程师肯·詹宁斯(Ken Jennings)之后的六年来,人工智能已经有了很大进步。电脑在多种游戏中战胜了人类顶尖选手,这其中包括跳棋、双陆棋、扑克和围棋等,甚至还有日本任天堂公司(Nintendo Co.)在2001年推出的电子游戏《任天堂明星大乱斗DX》(Super SmashBros.Melee)。在这款对抗型格斗游戏中,可以让马里奥(Mario)和皮卡丘(Pikachu)等游戏中的角色对打。

超级电脑“深蓝”与国际象棋世界冠军加里·卡斯帕罗夫对战

电脑在这款游戏中的出色表现要归功于麻省理工学院(MIT)的研究人员,他们在2017年2月发表的一篇论文中记述了这一战绩。但《任天堂明星大乱斗DX》并不是学习机器花大量时间玩的唯一一款电子游戏。人工智能软件掌握的游戏不仅有《超级马里奥兄弟》(SuperMario Bros.)和《太空侵入者》(SpaceInvaders)等雅达利公司(Atari SA)早期推出的游戏,还包括《吃豆人》(Pac-Man)和《真人快打》(Mortal Kombat)等街机主打游戏,甚至还有最受欢迎的手机游戏《愤怒的小鸟》(AngryBirds)。一些乐观人士称,人工智能可以帮助我们解决世界上最棘手的问题,如癌症和气候变化等。那为什么人工智能系统花这么多时间玩游戏呢?

电子游戏《任天堂明星大乱斗DX》

这全是因为数据问题。麻省理工学院的软件工程师弗拉德·菲罗尤(Vlad Firoiu)说:电子游戏可以让人工智能软件在精心控制的环境下解决现实世界里的一些复杂逻辑问题,如不确定性、谈判、欺骗和合作等。菲罗尤参与了《任天堂明星大乱斗DX》游戏的电脑软件的研发工作。研究人员可以让新的人工智能软件在最开始时应对相对简单的电子游戏问题,运行上万次或上百万次实验后,当软件系统学会了如何解决最初的简单问题时,再逐渐过渡到更复杂的挑战。

“通过游戏,想要多少数据就可以生成多少数据。”

总部位于伦敦的人工智能公司DeepMind Technologies Ltd.的首席执行官德米斯·哈萨比斯(Demis Hassabis)说。该公司是谷歌(Google)母公司Alphabet旗下的公司。“你想找到最佳切入点,选择的游戏项目对于你目前的算法来说不能太难也不能太简单。”过去3年来,DeepMind训练的软件掌握了雅达利游戏并击败了全球顶尖的围棋选手。围棋是一种在亚洲很流行的策略性桌面游戏。

DeepMind Technologies Ltd.的首席执行官德米斯·哈萨比斯

非营利实验室OpenAI的研究人员约翰·舒尔曼(John Schulman)表示,游戏环境为强化学习提供了理想条件。该实验室得到了很多知名人士的支持,其中包括特斯拉公司(Tesla Inc.Tesla Inc.)的老板埃隆·马斯克(ElonMusk)、Y Combinator的联合创始人萨姆·阿尔特曼(Sam Altman)和风险投资家彼得·蒂尔(Peter Thiel)等。强化学习意味着机器通过试错找到正确的动作顺序。而受控环境同样提供了帮助,用赛车游戏教算法如何开车要比用你的车安全得多。优步(Uber)旗下自动驾驶卡车公司Otto的一位工程师尝试教人工智能软件玩《侠盗飞车5》(GrandTheft Auto V),而英特尔公司(Intel)的一个开发团队也做了同样的尝试。

哈萨比斯说:DeepMind主要致力于人工智能在游戏领域的研发,因为该公司相信,真正的通用人工智能将必须理解其在实际景观中的存在。游戏中的模拟环境是无需制造机器人而做到这一点的一个方法。机器人可能会让人很头疼。“机器人行动迟缓,还会出故障。你无法让运行速度比实时更快,也无法同时运行上百万个机器人。”哈萨比斯说。

不过,一些颇具影响力的公司高管对游戏研发不屑一顾。微软公司(Microsoft)首席执行官萨蒂亚·纳德拉(Satya Nadella)在该公司2016年9月的开发者大会上说:“我们并不寻求让人工智能在游戏中打败人类。”他表示:取而代之的是,他们将公司的未来押在了让人工智能成为帮助“解决社会和经济中最迫切问题”的一种手段上。微软英国剑桥人工智能实验室的主管克里斯·毕晓普(Chris Bishop)表示,让竞争性电脑游戏成为人工智能的基准也增加了有关聪明的电脑对人类构成威胁的担忧。

微软公司(Microsoft)首席执行官萨蒂亚·纳德拉

尽管如此,微软还是创建了基于电子游戏《我的世界》(Minecraft)的人工智能研究平台Project Malmo。而这款游戏碰巧是微软公司自己的。毕晓普说:《我的世界》没有人类对抗机器的故事设定,因为没有固定的目标,所以不一定具有竞争性。

Microsoft的研究员们认为Project Malmo可以加快AI方面的研究

博弈模型方面取得的成功并没有让其他人工智能研发人员却步。除了《侠盗飞车5》,他们还用其他游戏进行实验,其中包括《星际争霸2》(StarCraft II)、《蒙特祖玛的复仇》(Montezuma's Revenge)以及基于游戏大师席德·梅尔(Sid Meier)《文明》(Civilization)系列的一款免费游戏Freeciv。但是,正如OpenAI实验室的舒尔曼所说,“真正的难题是开发出能够掌握所有游戏而非一款游戏的人工智能系统。只有这样,人工智能技术可能才准备好应对现实生活,而不是休闲游戏《游戏人生》发明者米尔顿·布拉德利(Milton Bradley)在游戏中展示的虚拟生活。”

编辑:赵建凯、赵隽杨、曲佳钰

翻译:一毫

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部