来源: 玩物志 (ID:coolbuy),本文获得作者授权
前天,人类的围棋史结束了。
有人会问:等等,人工智能阿法狗不就已经打败人类排名最高的围棋手柯洁了吗?
没错。
但是严格说起来,打败柯洁的阿法狗仍然是人类棋手的徒弟,它从人类棋手的对局中学习棋招,不断改进,最终 3:0 赢了柯洁。
徒弟赢了师傅,有什么好难过的?这说到底还是人类的围棋在升级啊!
可是这一次事情完全不一样了。
首先介绍一下阿法狗家族
阿法狗有兄弟三个。
它们都是 Google 的深度学习小组创造的人工智能,专为围棋这种游戏而设计。
老大阿法狗李(AlphaGo Lee),2016 年 3 月 4:1 打败韩国棋手李世石。
老二阿法狗(AlphaGo Master),2017 年 5 月 3:0 打败中国棋手柯洁。
老三阿法狗零(AlphaGo Zero),自学围棋 40 天,打败所有人。
对老大和老二,大家可能很熟悉,毕竟都和人类棋手对战过,新闻报道什么的很多了。
5 月份的时候,老二打败柯洁之后,Google 深度学习小组就宣布:以后不搞人机围棋大战了。所以,老三被创造出来之后,一直就养在家里,压根没露过面。
老三阿法狗零跟两个哥哥的履历完全不一样。
老大老二的学棋过程,都是工程师把围棋规则、大量的人类棋谱扔给它们,说,照着这个学吧。
学到差不多的时候, 就把它们拉到网上,跟人类棋手实战。
海量的人类棋局,是老大老二成为冠军的基础。
等到老三出生,工程师只是给它画了一个棋盘,告诉它:这是棋盘,这是黑子,这是白子,规则是被围起来的棋子就死了。好了,你自己学下围棋吧!
如果是我,肯定懵逼啊!
但是老三竟然就乐呵呵地学起来了。
老三的非主流学棋过程
老三学棋, 只有一个办法,就是自己跟自己下。
刚开始的时候,它就是个完全不懂围棋的孩子,甚至会把棋子瞎放,自己把自己怼死。
有段时间,它热衷于吃子,吃得兴高采烈,完全不顾死活。
慢慢进化之后,它发现了如果先占住棋盘的边和角,后面就会很占便宜。
它又学会了如何「打劫」、「征子」。
后来,它甚至懂得看「棋形」了。
学棋第 3 天,它已经跟自己下了 490 万局棋,然后打败了老大阿法狗李。
第 21 天,它打败了老二。
只用了 40 天时间,它完整地走过了一个人类棋手学棋的全过程,而且,这个过程中,完全是没有人类参与的。
它还无师自通地创造出很多新的招法,都是人类棋手闻所未闻的。
换句话说,老三学棋,和人类没毛关系。
它完全就是在自娱自乐好吗?
难怪人类顶尖棋手柯洁发出了这样的慨叹:
这里没有任何预设的知识,没有人类对对局可以参考,除了规则什么都没有。
老三是完全从零开始学习围棋,所以,它的名字里有个零(Zero)。
而深度学习小组发表的论文题目就叫《不借助人类知识征服围棋》。
人工智能的下一个目标
人工智能不会停下,只会越来越快。
干翻了围棋之后,它们的下一个目标是「魔兽世界」。
真的不知道以后,人类还有什么游戏可玩?
当然,都知道人工智能玩游戏是为了学习,为了更好地解决医疗、教育、能源、金融等等各种复杂问题……
好吧,我就是有点不甘心。
Over。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有