AlphaGo六十连胜对局解析
上QQ阅读APP看书,第一时间看更新

第二篇 追忆吴清源师父

从吴清源到AlphaGo

是三子而不是三目

“什么?让三子?”职业围棋界炸开了锅。

2017年5月24日,在乌镇围棋峰会的论坛上,谷歌DeepMind团队技术负责人大卫·席尔瓦先生宣布:“去年和李世石五番棋AlphaGo版本,经过这段时间的深度学习,进步了三个子。”对战的另一方柯洁则在微博里说:“这个差距有多大呢?简单地解释一下就是,一人一手轮流下的围棋,对手连续让你下三步……就像武林高手对决让你先捅对方三刀一样……我到底是在和一个怎样可怕的对手下棋……”

AlphaGo以4 : 1战胜韩国顶尖高手李世石,是在2016年3月。十个月之后,AlphaGo又在与柯洁的对决中连赢三局。

旗开得胜的第一局中,执白的AlphaGo虽然只胜了1/4子——这是围棋比赛计算的最小值,但是在职业棋士看来,那盘棋AlphaGo一直掌控着局势,柯洁根本没有胜机。况且比赛的结果以输赢计,输多输少本无意义。

AlphaGo每时每刻都在进步,我们人类喝杯水、吃点东西的时候,我们睡觉的时候,它一直在深度学习。这次的三番棋,柯洁拼死战斗,但是周边对于胜负的预测是一面倒的,说柯洁有10%的胜率已经是很乐观了。因此,我期待的是AlphaGo会不会带来一些更加神奇的、甚至是我们职业棋士也看不懂的着法,期待着看到人机之间更加精彩的对抗。

但即便如此,三个子,仍然是太深的一道鸿沟。芮乃伟甚至觉得,会不会是我们理解错了,说的“three points”(三目)而不是“three stones”(三子)?因为即使是三目,在职业棋士看来也已经非常悬殊。

午餐时,大家仍然在热烈讨论中。徐莹突然说,我们直接去问问哈萨比斯吧,就是没人翻译。我说我来啊,就是不知道他在哪。四下一望,DeepMind创始人、AlphaGo之父德米斯·哈萨比斯先生正在大餐厅另一头的角落里就餐。

说去就去。我走上前说:“对不起,哈萨比斯先生,打扰你午餐了。我们是职业棋手,有个问题想请教你。”哈萨比斯先生站起来说:“很高兴认识你们,请问吧。”

我说:“我们很尊敬你们,你们团队做了了不起的事情。想请教的是,上午席尔瓦先生说,现在的AlphaGo比和李世石对局时进步了三个子,这是表示在棋盘上的三个子呢,还是三目?”哈萨比斯先生回答:“是三个子!”同时他比划了一个在棋盘上落子的动作。

我转身告诉大家,他说是三个子。徐莹急了:“这是真的?三个子可是很大的差距啊!”哈萨比斯先生像是听懂了我们的对话似地,点点头,又解释道:“不过,这是我们内部由新旧两个版本自己对弈后的胜率统计而测定的标准,并不说明可以让人类棋手三子。”之后又补充一句:“Maybe two stones.”(也许两子。)

我谢了他,然后说:“真是太了不起了!AlphaGo在2017年新年时在网上下的60盘棋非常厉害,我仔细地打谱研究。AlphaGo的棋下得太精彩了,去年对李世石第二盘的黑37尖冲,就很像吴清源老师的思路。我把这一手印在T恤上,发给自己的学生穿,这次也带来了,希望能够送给你。”哈萨比斯先生说:“就交给我的助手海伦吧,谢谢你!”

我说我还有一个建议,我们都很想看到AlphaGo自己对下的棋谱,能不能发表一些,供我们学习,哈萨比斯先生说会考虑。

我们再次感谢他。徐莹请他签了名。走过两个桌子,碰到美国围棋协会主席安德鲁等几个朋友,我们便停下来一起讨论。有人说本来这次有过这个想法的,AlphaGo让职业棋手三子,看看会是什么结果。可也许职业棋手不愿意吧。乃伟脱口而出:“我愿意啊,我想看看AlphaGo到底有多强。”记者朋友笑了:“那我们是不是应该向DeepMind团队提出来啊?乃伟从来都只想着棋盘上的事儿,她才不在乎输赢和面子呢。”

这时,哈萨比斯先生从餐桌那里径直向我们走来,微笑着说:“我想跟你们一起拍照可以吗?”“当然可以!”,我回答道。拍完照,哈萨比斯先生问:“你们两个都是九段?”我说:“是”。他问:“还有别的九段夫妇吗?”我说:“目前还只有我们”。然后我说:“我知道你是国际象棋大师,13岁就拿到了大师称号。”他笑了,很开心的样子。助手在催他去下一个日程了,他说:“让我们共同期待明天的对局吧。”

重现一个更厉害的吴清源

哈萨比斯的父亲有希腊和塞浦路斯血统,母亲是华裔新加坡人。他1976年出生在伦敦北部,不仅在13岁时获得了国际象棋大师称号,还是五次获得“智力奥运会”精英赛冠军的世界纪录保持者,被誉为这个星球上最聪明、身价约合6.3亿美元的人工智能专家。

在乌镇的演讲里,哈萨比斯说:“AlphaGo和当年的吴清源先生一样,引发了一场围棋革命。希望这次能对围棋界有所帮助。”他还特别邀请了吴老师的女儿来到乌镇观战,可见他对吴清源老师的尊敬。

我后来告诉哈萨比斯,吴清源有两名弟子,一位是林海峰。他说林先生他知道的。我说还有一个,我指指身边的乃伟:“就是她!”哈萨比斯先生笑着对乃伟说:“没人告诉我你在这里。”

吴清源老师步入老年后仍然每天研究围棋,探索精神永不停止。20世纪90年代初,他收了芮乃伟做弟子,教给她很多着法,帮助她打开思路。同一时期,吴老师将他的研究心得以“二十一世纪的围棋下法”的题目发表。吴老师认为,现代人局限很多,经常走进死胡同,棋士应该以更加自由而广阔的视野来注视棋盘。

作为弟子,芮乃伟是在吴老师晚年聆听他教诲最多的棋手,可惜的是当时她正式比赛很少,得不到很多实践的机会,另外也有天资和棋力方面的局限。她是尽可能地在有限的对局中运用吴老师的思想,有些效果不错,但是也有很多地方理解得远远不够,或者后续手段没有跟上。吴老师21世纪的围棋,没有被大家普遍理解和接受,有吴老师的理论太超前的原因,但也有乃伟这个弟子不得力的原因。

我对哈萨比斯说:“我们都很希望能够有机会和AlphaGo对局。不过我更希望,如果有可能的话,把吴清源老师精彩的棋局都输进去,让AlphaGo帮我们重现一个更厉害的吴老师,或者帮我们更好地理解吴老师当年的想法(能看到AlphaGo的后台分值就可以)。”哈萨比斯先生说:“这个主意很好啊!我们要找个时间坐下来好好聊一聊。”

此前,在和DeepMind团队的研发专家谈话时,我就提出了这个希望:AlphaGo能不能展现出历史上各位大家的棋风,让我们看到一个更加强大的吴清源老师或者武宫正树九段。换言之,一个更有特点的、有人文精神的AlphaGo。

其实AlphaGo已经在这么做了。去年战李世石的AlphaGo,更多的是传承和总结,通过深度学习,融会贯通人类在围棋上的精华部分。而现在的AlphaGo,是在此基础上,完全左右互搏,用自己的学习和判断,进行再创造,展现出远超人类的强大实力。

对李世石的第二局,黑37五路尖冲,这一手超出了所有职业棋手的想象。我当时看了真是热泪盈眶,觉得吴清源老师又回来了。

“200岁之后我在宇宙中也要下棋”

1934年1月29日,日本东京数寄屋桥的旅馆,近代日本围棋史上一盘非常重要的对局进入了官子阶段。19岁的吴清源对阵61岁的秀哉名人,这场历时三个半月的比赛终于要到终点了。

盘上是执白的秀哉名人稍稍有利的形势。对局中,吴清源起身离座去洗手间。他拉开纸隔门,低头找到拖鞋,一抬头无意中看见休息室里黑压压一群人安静地端坐着,身穿和服正装,每个人手里都拿着棋谱,上面列出各种收官方式直至终局的路径。也就是说,本因坊门下已经将所有的官子都彻底研究透了。虽然人这么多,可是鸦雀无声,气氛异常紧张。

这盘棋从1933年的10月16日开始,一直到1934年1月29日才结束。对局吸引了全日本围棋界乃至其他各界瞩目,因为一方是刚刚获得全日本选手权战冠军的19岁的吴清源,而另一方是代表传承日本三百多年围棋历史的本因坊家族的秀哉名人。这注定是一场新旧势力的对抗,而吴清源的中国人身份,又使比赛戴上了国际棋战的标签。

比赛的规则是每周的星期一下四个小时,白方秀哉名人可以随时暂停,而执黑的吴清源则必须在每一次对局中下最后一手棋,这意味着每回比赛暂停后,秀哉都可以回去研究,而事实上他也这么做了——召集所有门下弟子研究对策。

这样不平等的规则,是日本职业比赛的传统,每逢重大比赛,上手一方是可以随时暂停的。由此带来的便利条件是逢难题他可以回去研究,甚至是集体研究。本因坊门下将才如云,前田陈尔就是出类拔萃的一员虎将。

当时吴清源正处于用新布局下棋的狂热时期,执黑第一手即于右上下三三,接着又在对应的角上下星位,第五手则下在天元,就是著名的三三星天元一局。下三三在当时是注定要引起轰动的,因为三三对本因坊门人来说是禁着。历代本因坊早就宣布了三三不是好棋,所以不单本因坊一门不能下,就是别的门派的棋手,也是不敢下的。尽管吴清源在研究新布局的过程中下了很多次,但是敢在秀哉名人面前下出来,依然遭到很多非议。有些报纸评论说,吴清源第一步的三三是对本因坊的无理挑战,甚至说这是心理战的一部分。很多抗议的信件写给了主办方读卖新闻社。

从技术方面看,三三之所以被历代高手所唾弃,是担心过于注重实利,不利于中央作战。这似乎也是有道理的。第三手的星,又是重势的一手,在传统的思维中也不受待见。那时的正统是小目,认为兼顾势和地。

那么问题来了,重实地的三三和重势的星的结合,到底要干什么呢?更有甚之的是,第五手天元!到底是要势呢还是要地?看上去实在是有些矛盾的,有违当时的围棋观,即使是善意的人们,也是不能理解。下棋最重要的是连贯性,加上长期以来“金角银边草肚皮”的说法根深蒂固,下在天元?这不是草肚皮嘛!总之,这真是一个奇特的布局。

多年后的今天,我们看到AlphaGo就是这么下的:一会儿尖冲对方的小飞角,是取势的下法,紧跟着就点三三了,完整的实地路线。那么我也想问,“阿老师”究竟是要取势还是取地呢?原来,不单单是三三星天元那局棋的时代大家没能明白吴清源老师超前的围棋观,就是80年后的我们,也没能真正理解吴老师啊!

现在,横空出世的AlphaGo,使用了很多吴老师曾经提倡的思想与战术。吴清源曾说过:“200岁之后我在宇宙中也要下棋。”也许,上天是通过AlphaGo传递给我们吴老师的信息,盘上那些自由而无拘束的着想,映照出吴清源老师一生中那些令人难忘的场景和可歌可泣的精神。AlphaGo帮助我们更好地理解和体会吴老师当年的教诲,使我们更加明白吴清源这个名字的伟大。

来一场淋 漓尽致的失败

下午,一不小心去了杰夫·迪恩的记者会——后来才知道这个软件工程师有多牛,据说谷歌员工认为谷歌搜索惊人的速度都归功于他。举手提问的记者非常多,感觉都是科技圈的,和我们职业棋手的关注点有所不同。

会后,主办方好意安排我和他聊几句。我先做了自我介绍,然后告诉他,在美国时我家就在Mountain View,离谷歌总公司很近,甚至比你们公司还要早进驻硅谷,他笑了。于是我问他,AlphaGo的开发会一直继续下去吗,有没有目标,比如准备进步到什么程度。杰夫马上严肃起来,答道:“这个要去问DeepMind团队……”我再问:“我现在正在从事围棋的儿童教育,你觉得人工智能,比如AlphaGo在对孩子的教育方面有些什么帮助?”杰夫很认真地说:“人工智能会很好地启发孩子们的创造力。”

谢过了他,我们一起下楼,说了再见。过了一会儿,我正和一些朋友聊天,看见他又转了回来,一脸迷茫。问他是不是迷路了,他说听说有咖啡喝,可是怎么找不到呢?我赶紧指给他方向。美国公司这么顶级的牛人身边是没有助理的。

再次跟杰夫说“Bye”,回头继续聊天。美国围棋协会的另一位朋友,安德鲁·杰克森负责这次宣传的工作。他说:“我听说你有学习AlphaGo 60局的笔记,我有没有荣幸看呢?”我马上把包里带着的两本拿出来送给他。他说要把它翻译成英文,这可以帮助很多人学习。我说:“没问题,如果可以帮到更多人我就太高兴了。”

不一会儿,欧洲围棋协会主席马丁也跑来要学习笔记,自然要送。我很愿意分享自己对AlphaGo的学习体会,希望更多的围棋爱好者能够欣赏到“阿老师”在盘上的出色表演。

就像我在柯洁对AlphaGo第一局之后接受新浪专访时说的,这次人机大战的结果是没有悬念的。比起胜负,我更希望的是,柯洁放开了拼,下出他的最好状态,“来一场淋漓尽致的失败”,这样也可以迫使AlphaGo展现出更强的实力。

记得去年李世石输给AlphaGo的时候,乃伟难过得天昏地暗。但现在,她和我一样,都由衷地为“阿老师”鼓掌,心心念念希望看到更加美好的围棋。

AlphaGo就像一面镜子,能够映照出最好的那个你。如果你实力一般,表现平平,AlphaGo没准只赢你几目;而如果你下得精彩,那么,AlphaGo也会精彩,会更加精彩。