当前位置: 首页 > 资讯

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

机器人网       2017-05-26

昨天上午10点30分,人机大战第二局正式拉开帷幕。AlphaGo执黑先行,柯洁执白。

下午1点40分左右,柯洁投子认输,人工智能程序AlphaGo取得了第二场胜利,在这场人机大战中以2胜锁定胜局。本次对弈的两位在对决中都显示出了高超的棋艺,其中AlphaGo第53手、柯洁第88手令人叹为观止。虽然柯洁中盘认负,但作为当今世界棋坛第一人,他展示出了非凡的棋艺和大局观。

赛后,Deepmind的创始人Hassabis坦言,在他们的算法框架下,柯洁的前15手堪称完美,而他的前100手同样表现出色,是迄今为止在数据上最接近AlphaGo的棋手。7路围棋尚且变化多端,19路围棋更是高深莫测,柯洁在前100手达到了极致,这样的计算负荷可以算得上是人类大脑极限了。

赛况回顾

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

开局AlphaGo执黑先行,第一手落在己方右下角可谓“惊世骇俗”,让对手柯洁迟疑了至少两分钟。在第一局中,柯洁自点三三削弱了自己的棋势,是落败的一个原因,有趣的是,这一次AlphaGo使出了三三定式,棋风强硬。

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

第53手,AlphaGo“挤断”白棋,出人意料,在场解说的周睿羊九段直言这一招无比“刺激”,“竟然还能这么下”。诸多棋友也纷纷表示这一手堪称“神之一手”。后几步柯洁一度陷于劣势,后依靠第56手、第63手把AlphaGo引入战局,左下白棋存活。

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

白棋第88手十分精妙,充分显示了柯洁的大局观。此时左下“活死劫”已出现,这一手为棋盘上三处白棋提供了连接,若黑棋失掉左下,那左侧布局的黑子也会尽数失去意义,与之相对的,白棋的“地盘”就会大大增加。

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

到此处之前,柯洁一直利用“劫材”把AlphaGo“耍”得团团转,白棋一度有获胜的希望,但是或许是太紧张了,柯洁和解说的古力九段一样把“劫材”算错了。

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

第136手,白棋选错“劫材”,AlphaGo判断这个损失可有可无,果断137手沾“消劫”。黑棋成功“屠龙”,白棋大劣,难以为继。

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

155手后柯洁投子认输,AlphaGo赢得了本场比赛的胜利。由于本次比赛是三番赛,AlphaGo已赢2局,提前成为比赛胜者。

相关解读

熟悉围棋的朋友可能知道,AlphaGo起手就犯了一个非常严重的错误:把第一手棋落在了己方右下角。围棋是一项高雅的竞技运动,也是一门艺术、一种文化。因此,围棋的精神、品格对于棋手来说尤为重要。在对弈中,先手落子的一方(黑棋)通常会把棋下在右上角以示尊重,换言之,把棋下在己方一侧是对对手的不敬和羞辱。事后在问答环节,有人提出了这个疑惑,Hassabis为此向柯洁致歉。AlphaGo虽然棋艺高超,但它的围棋是建立在抽象分析和算法基础上的,整个棋盘对它来说是对称的,它分不清己方对方,甚至无法理解白棋黑棋的图形意义,因此出现这种错误纯属技术原因。

此外,本次对决出现了精彩的“死活劫”,相关术语有“打劫”“劫材”“消劫”,想必让不了解围棋的朋友十分费解。今天小编不分析AI,和大家谈谈围棋,下面是小编个人的一些理解:

打劫:打劫是一种围棋规则。该规则要求下棋时,在提掉对方一颗子之后,己方所落之子即使仅剩一气,对方也不能立即落子提回,必须要在其它地方落子,等到下一手才能提这颗子。

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

上图就是一个最基础的“劫”,若黑棋下在星位,那3号白棋就会被提子。相反地,若白棋又把棋子下在此时3号的位置,那星位的黑棋就会被提。图中的“劫”只是一子之争,但很多时候一个“劫”会涉及到整片棋子的生死存亡,甚至是整局棋的胜败。之所以要求“打劫”后要在别出下子才能回过头来处理,是因为如果双方反复互相提子,那棋局就进行不下去了。

打劫规则可以看作是更广义的“禁止全局同形再现”规则的一个特例,即,禁止对局陷于无限循环之中。

“消劫”:打劫的时候,一方把劫争的空位填上,劫争即结束。本次对弈中,黑棋第137手沾把黑棋连上了,“劫”没了,柯洁利用“打劫”换取优势的想法就落空了。

“劫材”:被“打劫”后,被提子一方必须在其他地方落子,这时提子方可能“消劫”,所以一般被提子方要预留一些关键位置,逼迫提子方跟着应对,这些关键的位置被称为“劫材”。前文提到的白棋第136手就是个“失败”的劫材。“劫材”对棋手的要求很高,一般只有高端棋手会在对局中制造大量“劫材”。到135手时,棋盘上其实只有3个劫材,柯洁把白棋下在了第136手的位置,AlphaGo认定这是个小“劫材”,不痛不痒,就“消劫”了。

人生如棋,一招失算,满盘皆输,在面对如此复杂的局势判断时,人脑难免会因为迷惑出现判断失误,或许这正是人类的一大缺点。

赛后访谈

古力:我想问一下Hassabis先生,这是一场精彩的比赛,柯洁一度发挥得非常完美,那他是从哪一步才开始展现劣势的呢?当你们在后台观察数据时,柯洁的胜率有没有比较高的时候?

Hassabis:我们在控制室观看了比赛,的确,在刚开始的时候,柯洁表现得非常完美,他是迄今为止前100步和AlphaGo最势均力敌的人。

新华社记者:Hassabis先生您好,我们观看了第一局的比赛,那时AlphaGo官子表现并不完美,请问您能从技术角度解释一下这个现象吗?对于这场比赛,白棋是否有一个时刻是占优的?

Hassabis:第一局官子的精彩程度或许有些让大家失望。但AlphaGo追求的是获胜概率最大化,所以会放弃一些点,相比较于赢三子获胜概率为90%,它更倾向于赢1/4子获胜概率为95%。对于第二个问题,我可能不是最适合回答这个问题的人,因为我本人并不太懂围棋,我只能说,前15手,甚至前100手,双方的获胜概率都非常接近,所以其实谁都有机会赢得比赛。

浙江卫视记者:我想采访一下柯洁。在比赛的时候,你一直手捂胸口,是不是压力很大?网上对这一回对弈给予了一致好评,你在接下来的比赛中会不会越战越勇?

柯洁:首先感谢大家对我的支持,我当时捂胸口是觉得自己有机会。第一盘AlphaGo比较稳健,第二局出现了一个劫争,电脑一直撑在那儿,让我看到了胜利的机会,虽然它可能不是这么想的。我想我的心态还是不够沉稳,所以下了许多坏棋。我觉得很遗憾,但也觉得自己发挥得挺好。在胶着状态时没有让大家看到精彩战斗,是我太紧张了。希望我在接下来的比赛中也有好的发挥,我不喜欢安乐死,今天的棋局让我热血沸腾。

主持人:我也想问一个问题,这一局很多时候是柯洁在主导战斗局面,那这一局的AlphaGo跟第一局有什么不一样?

Hassabis:不得不说这真的是一场非常精彩的比赛。很多时候AlphaGo也遇到了很多困难,柯洁把棋局压到了非常激烈的局面,他的确有很多机会能赢。

观众:请问Hassabis 先生,AlphaGo到底是怎么下棋的?

Hassabis:AlphaGo有个机制去进行评估,它会依据胜率来选择下一步该怎么下。今天我们也看到,棋面上出现了很多势均力敌的局势,尤其是前15手,完全呈胶着状态。整局棋至少有50手竞争激烈,对于在控制室观看比赛的我们来说,这一切都是前所未有的体验。

CGTN记者(英语):首先祝贺柯洁,这真是一场非常精彩的比赛。请问你对于跟机器计算能力这么接近,会感到开心吗?你对明天的比赛是不是很有信心?是不是已经找到了打破AlphaGo模式的方法?请问Hassabis 先生,您在上午发的推特是不是想说明AlphaGo是最顶尖的棋手?

人机大战第二局:AlphaGo锁定胜局 柯洁虽败犹荣(附访谈)

柯洁:如果你是中国人,你应该用中文来问我问题。(掌声)其实我不觉得这场对决我是能有机会去获胜的,我只想着尽力去下好我自己的棋,下我觉得对的棋。观众和AlphaGo对我的肯定让我很激动,我后面太紧张下了很多昏招,今天的棋是对我最大的鼓励。

Hassabis:我的推特绝对是表达了对柯洁极大的尊敬。我的推特面对的是全球媒体和AlphaGo的爱好者,我要让他们看到柯洁有多厉害,这是我上午发推特的目的。Master在自我对弈方面比上一版本更强,和李世石对战的第四局第76手这种错误绝对不会再犯了。现在的它不需要人类棋手帮助找到它的缺点,但我们还没有真正请人类棋手对AlphaGo可能存在的缺陷进行评估。

新浪棋牌记者:请问Hassabis先生,上一次对局李世石的时候,赛后几个月,你们公布了详细的对局数据,那此次三局比赛的数据大约会在什么时候放出来,你们会提供更多变化图吗?

Hassabis:我们还没决定什么时候发布数据。赛后我们会在学术刊物上把所有技术细节,包括最新技术细节、架构,全部披露出来,但现在我们还是聚焦比赛吧。

封面新闻记者:为什么一直是黄博士在代替AlphaGo落子,普通人能坐在那个位置吗?如果是古力坐在对面,请问柯洁会不会有情绪上变化?

Hassabis:黄博士是一位优秀的业余围棋选手,他经常参加围棋赛事,知道如何正确下子,也很冷静。我们觉得这些特质非常重要,也是我们选择他代替AlphaGo落子的原因。

柯洁:黄博士是AlphaGo核心人物,他坐我对面就像个机器人一样。如果换成古力老师来摆,当AlphaGo下出一些难以理解的棋的时候,他可能会有惊讶的动作。而黄博士目睹了AlphaGo的成长,更冷静,让我更有和AI对决的感觉。黄博士真的很想个机器人,我下棋的时候很爱动,但是黄博士坐在那儿简直纹丝不动。

Hassabis(笑):这一点我很认同。黄博士真的很像机器人,可能他在赛前事先对着镜子做过彩排。

主持人:我想问一个问题,为什么黑棋第一步下在左下角?因为按照围棋礼仪,黑棋第一手一般得下在右上角。

Hassabis:对于AlphaGo来说,它没有上下左右的区分,什么都是对称的,所以出现这种错误很对不起,我在这里向柯洁道歉。

柯洁:对于这一点我能够理解,毕竟它是机器。AlphaGo在比赛时很冷静,许多人类棋手也会故意把第一手下在自己一侧,来削弱对方士气。

果壳网:请问Hassabis先生,你们作为内部技术人员,一直坐在控制室观看对弈,我想问你们所理解的Alpha围棋是什么样的,和棋手的理解有何不同?普通人有可能理解你们看到的东西吗?

Hassabis:我们本身都不是厉害的棋手,需要通过AlphaGo才能理解围棋。这一点非常振奋人心,AlphaGo的每一步都让我们兴奋,所以我觉得我们对AlphaGo的理解确实和专业棋手有所不同。我们看到的只是统计数据、估值中的数字,如果发现哪里数据出现异常,我们会咨询樊麾这样的专业棋手,他会提出专业的意见。我们关注的是AlphaGo有没有形成自己的风格,有没有一些倾向性的爱好,以及它在面对柯洁、李世石这样的天才棋手时,我们将如何调整让计算机达到最好状态。

智能运动网记者:请问柯洁,经过这两场比赛,你觉得觉得AlphaGo达到了什么程度?你会给自己的水平打几分?Hassabis先生,你觉得AlphaGo完美吗?

柯洁:在AlphaGo还没出现前,我觉得自己有50%;在它出现以后,我觉得自己对人生的看法也发生了改变。未来不可预测,我只能做好自己。如果说AlphaGo是1的话,我觉得自己只有2%。我赢不了他,所以它对我而言是100%,是“围棋上帝”。对于围棋,我的理解还太有限。

Hassabis:我还不知道怎么回答,我们想让AlphaGo每天都变得比以往更强大。这次比赛能让我们每个人都更接近一百分。

柯洁:我还一个不情之请。我发现黑白棋对AlphaGo的影响很大,如果执黑,它的第一手胜率在45%左右;如果执白,它的第一手胜率会到55%。所以后天能否让我执白,没想到和电脑下棋都这么热血沸腾,有和人一起下的感觉。

Hassabis:这个完全没有问题,第三场比赛我们执黑,你执白。

主持人:这个不是问题,这次比赛主要是交流沟通,我们会尽量满足大家的需求。最后,我只想说:柯洁让我看到了人类围棋的未来!

关键词:AlphaGo