来自未来的AlphaGo——第二次人机大战有感
在不远的将来,基因分析师以及分析基因数据的软件会变得热门,遗传学会进入医疗保健领域……你的病就像你的个性一样,独一无二,并且被单独对待。
20世纪90年代初,我刚到美国时就接触了围棋人工智能。我和开发它们的工程师们每年会见几次,给他们出出主意、提点建议。那个时候的人工智能有点像牛车,缓慢而坚定地前行着,虽然可以清楚地看到它们的进步,但是感觉还是离我们很远很远。
大约10年前,我到加拿大班夫参加了一个数学家与IT人士的国际性年会。参加会议的都是这方面的专家,只有我一个人是纯粹的棋手。目前世界上有大约6 000种智力游戏(包括所有的棋类、牌类,还有许许多多我们想也想不到的),但是,只有围棋,还坚守着人类的防线,其他的都已经完全被计算机攻克了。我亲眼看到有人拿来一种新发明的游戏,只需一夜的时间,就一定会有人写出破译的程序。到了第二天,人就玩不过计算机了。但是大家都在感慨,围棋太难了,太多变化了,计算机算不过来啊!那时,我真为我们老祖宗的发明感到自豪。
慢慢地,围棋的人工智能发展起来了,很多国家都有IT人士在研究与开发,各种围棋软件相继出现,实力也大大提高了。不过我们还是认为,人工智能要赶上人类还早,至少在我的有生之年,人类还是可以赢过计算机的吧!
2016年1月27日,谷歌在《自然》(Nature)杂志发表论文,介绍了DeepMind团队开发的AlphaGo,以及它5 : 0战胜欧洲冠军樊麾的消息和棋谱。
我注意到,在与樊麾的对局中,AlphaGo展现出很强的实力。不过,当时的围棋界还是比较乐观的,大家认为从棋谱看,计算机是厉害了,但是没有厉害到可以和职业围棋的一流高手抗衡的地步。所以在AlphaGo和李世石的人机大战前,一般大家都预测李世石五盘全胜不成问题。
对于一直比较关注围棋人工智能进展的我来说,坦率地讲,对这次大战的人类方并不是那么有信心。看了AlphaGo对樊麾的五局棋谱,感觉计算机已经非常接近人类最高水平,尽管看上去它的很多着法还是有点拙,赢得也不多,但是计算机从来没有落过下风……很多人没想到AlphaGo第一局就赢了,而且赢得非常漂亮,也没想到最后4 : 1的结果,居然是李世石只赢了一盘。当然那是一盘伟大的胜局,李世石在形势不利的情况下弈出“神之一手”,引出了AlphaGo的bug(错误)。
从那次人机大战的整体看,AlphaGo下得漂亮。比如第二局黑37手的尖冲,令人荡气回肠,感觉是吴清源老师回来了。吴老师曾说:“200岁之后我在宇宙中也要下棋。”那么,这是AlphaGo将吴老师的思想传递回来了吗?想及此点,我异常感动。
2017年新年AlphaGo再度出山,以Master的网名在各大围棋对弈网站下了60盘棋,全胜。这60局,中日韩一流棋手轮番上阵,棋风迥异的顶尖高手们和AlphaGo在盘上激烈碰撞,为我们留下了精彩的棋谱。
在对60局棋谱的学习中,我们迎来了乌镇围棋峰会,人机大战第二季,由当前世界围棋第一人、年轻的柯洁对战AlphaGo三番棋。
此次人机大战的结果我觉得是没有悬念的,因为我仔细研究了Master的60盘棋(还写下打谱心得供大家讨论、一起学习),体会到了AlphaGo的强大。当然,我们希望柯洁赢,但是我更关心的不是胜负,而是AlphaGo会不会带来一些更加神奇的,甚至是我们职业棋士也看不懂的着法,我期待着看到人机之间更加精彩的对抗。
5月23日第一局,柯洁执黑。AlphaGo每一步都出乎我们的意料。特别是白54断,真是惊世骇俗的一手,记得芮乃伟当时不住地念叨:“什么意思?这不是后手吗?”是的,是后手,但是这步棋,完全消去了黑势,又使空虚的白角变厚了……
当天我在接受采访时说,AlphaGo的亮点是下出了人类棋手的一个盲点,这充分说明了我们人类思维的局限性。我从这盘棋学到很多东西,但是还不够过瘾,因为柯洁的黑棋有点拘谨,没有放开。而AlphaGo展示了它掌控局势的能力,掌握了布局阶段的一点优势后慢慢推进,平稳地走向终点。第二盘棋,我非常期待柯洁展现出自己的风格,希望看到他对抗AlphaGo的最佳表现。
在24日的论坛上,DeepMind的CEO哈萨比斯和AlphaGo技术负责人席尔瓦的讲座非常精彩,令观众了解了AlphaGo是如何依靠它的策略网络和价值网络进行剪枝和判断的。但是最令人震撼的是席尔瓦先生在讲话中说,AlphaGo Master(2017年初在围棋网上60连胜的版本,此次对阵柯洁也是同一版本)经过这一段的深度学习,已经比同李世石下棋时的版本进步了three stones。三子啊!听到这个说法,柯洁立刻在微博上发表了“天呐”的感叹。
本来现在职业与业余之间的距离都非常小,三子得是多大的差距啊!真是有点难以置信。午餐时我们特地找哈萨比斯先生求证。哈萨比斯先生首先肯定了这three stones就是三个子,而不是三目(three points),然后解释说这是系统自己测定的,按照“AlphaGo李”同“AlphaGo柯”自己对下时的结果估算出的实力差距,不说明和人类下也能让三子。不过,他又补充了一句:“也许是让两子……”
嗯,这也已经足够令人震惊了。想起2017年3月到日本的时候,碰到了武宫正树老师、赵治勋老师和小林光一老师,他们都不约而同地认为如果是60局连胜,按照棋份来说,那是两个子的棋份了。
25日第二局,一开始似乎柯洁小有不顺,但是他及时停住,转战下方,在进入中盘后成功地把AlphaGo拖进了一场乱战之中,这是柯洁最擅长的局面,可以尽情发挥自己的特长,感觉柯洁似乎放开了,拼命了,下得非常出色,可以说是为了逼AlphaGo使出了浑身解数。据赛后公布的数据,AlphaGo认为前100手是双方最善。虽然后半盘柯洁弈出问题手,棋局戛然而止,但是那一局棋,令许许多多的观众热血沸腾。
27日第三局,柯洁前半盘弈出问题手,之后奋力拼搏,一度使形势非常接近,但后半盘还是AlphaGo掌控了局势。我觉得,到了这时候,胜负更不重要了(当然对柯洁仍然是重要的),我们最期待看到的是他们两个下出什么样的棋,盘上的内容有多精彩,这一点,我想大家都没有失望。
去年,李世石与AlphaGo大战之后,我发表文章说:“李世石并没有输给机器,而是输给了人类创造出来的高科技。”今天的柯洁也是如此。他做了最大的努力,我们为他鼓掌。
这次现身乌镇的AlphaGo,在深度学习、硬件并行加速以及搜索算法的优化方面都有长足的进步。曾经听说,DeepMind要训练一个完全没有人类棋手痕迹的版本,事实不是这样的。确切地说,是在学习了人类棋手的大量棋局的基础上,再进行完全的自我对弈训练的。也就是说,达到一个高度后,它只需要自己克隆自己,昨天的自己就是今天最好的对手。AlphaGo的运行原理是遇强则强,我觉得,它就像一面镜子,能够反照出最好的那个你。
赛后的新闻发布会上,哈萨比斯先生宣布AlphaGo将退出围棋赛事!也就是说,AlphaGo将退出江湖,从现在起只给我们留下背影。DeepMind团队同时宣布,将陆续公布AlphaGo互搏的50局棋谱。今天先公布10局,我看了几个片段,那真的是有着许多可以颠覆围棋观的内涵啊,谷歌的武功秘籍公开了。
非常感伤,一段传奇真的就这样离开了吗?
回味这场“绝唱”,在传承方面,AlphaGo吸收了很多前辈高手的精华并予以再创造。在棋局中,我看到它的很多着法有当年吴清源老师的影子,心里非常感动。也许,上天是通过AlphaGo映照出了很多职业棋手在历史上那些让人难忘的场景,那些可歌可泣的精神。我相信,无论科技进步到哪一层面,人类文明的精神、围棋的精神是永远值得我们景仰和致敬的。
我们要向DeepMind团队致敬,他们创造了奇迹。仅仅三年,AlphaGo就打败了人类几千年的进化。AlphaGo团队的黄士杰博士说:“我看见了人因梦想而伟大的真实意义。”我想,我们职业棋士是幸运的,在这个科技突飞猛进的时代,我们能够看到超越人类极限的美好。仰望星空,来自未来的AlphaGo带给我们更加广阔而自由的视野。