当前位置: 首页 > 资讯

AlphaGo也冲动? 人机大战内部数据藏惊人谜团

小鱼时代       2016-08-13

日前,AlphaGo团队成员樊麾职业二段在欧洲围棋大会上披露了AlphaGo关于人机大战第二局的一些数据和变化图,有两个很有趣的事情樊麾表示无法解释,一个是AlphaGo的一步“疑似”妙手是它临时起意,走到那一步时才想到的;另一个是AlphaGo非常“冲动”地选择了战斗,但结果却令自己的胜率变低。


  图1:樊麾提到的第一个无法解释的情况是这样的,白棋三角一手在右上角挂角的时候,AlphaGo给出的变化图显示,它原计划的下法是左上角走完后,在左边5位吊一手。然而……


  图2:实战当李世石白棋走到三角这手拆二的时候,AlphaGo忽发奇想,走出了这手五路“尖冲”(全谱第37手),这手棋也是本局最大的争议所在,究竟是不是好棋,尚无定论。但我们也不是非得知道结果,樊麾说看到这手棋他泪流面面,因为真正感觉到了围棋的自由,在棋盘上那种无拘无束的自由……就像AlphaGo数据显示的,这手棋人类走出的可能性接近于零。


人类高手下棋的时候其实也经常出现这种情况,走到某个局部,忽然灵光一现,发现还有自己此前计算之外更好的下法。AlphaGo难道对局时也是这样?!


  图3:本局第二个无法解释的疑点。AlphaGo判断李世石白棋布局前面有些欠佳之处,下至此时黑棋的胜率已经升至55%,然后黑1尖冲左下角,寻求战机。


  图4:有趣的事情出现了,左下角的战斗,当进行到黑9挡住时,AlphaGo判断黑棋的胜率仅剩50%了……换句话说,AlphaGo在左下角主动出击,寻求战斗,结果却令自己的胜率下降了,难道人工智能也有“冲动”这种情绪不成?

  

  

冲动是魔鬼……

图5:按照AlphaGo的变化图,此时白1在四路打吃是最强下法,这样双方将形成复杂的战斗,胜率各半。中国棋手时越也曾摆出这个变化,与AlphaGo的看法不谋而合。


  图6:然而实战李世石却选择了在1位打吃,严重失误,这手棋走完,AlphaGo判断黑棋的胜率直升到了59%……


图7:接上图的后续变化,黑5档时,李世石白6立下太缓,接下来黑棋先手走到9位围空,胜率已经超过了60%。此时在被聂卫平评价为“十三段”的AlphaGo的后半盘面前,胜负其实已经没有太大悬念了。


  樊麾说,AlphaGo为什么忽然变招,为什么选择了胜率降低的下法,这两个问题,以目前他掌握的数据和知识,他无法给出一个理由充分的解释……

  我们能想到的一个合理的推测是,问题还是出在了围棋的复杂性上,即使是以AlphaGo网络版强大的计算能力,深度学习和强化学习产生的对弈经验,也无法在布局阶段把每手棋都计算到面面俱到。因此直到轮到黑棋走第37手时,AlphaGo的计算树才搜索到了这手棋的可能;同样在左下角的战斗中,AlphaGo挑起战斗伊始也没有发现白棋四路打吃的手段,因此选择了过分的下法,发现自己的失误之后,AlphaGo的胜率评估,自然就下降了。

 

  围棋与阴阳、太极、周易这些我们不觉明历的东西其实是异曲同工的

  不过就像樊麾一直在强调的,这些变化图和胜率评估只是AlphaGo认为的情况,是不是真理,我们无法断言。同样,我们的判断,我们的推测也是基于我们人类所接受围棋理念而得出的,究竟孰优孰劣,恐怕只能等后世评说了。

  对于围棋,对于这个世界,我们人类所知还是太少了……