制造业知识中心专业领域服务平台

AlphaGo至少已经达到二十段，人类还有机会吗？

roboticschina 2017-05-28

虽然没有人机大战1.0时的全球瞩目，柯洁与AlphaGo的人机大战2.0依然吸引了众多国人的目光，在经历第一局1/4子的惜败以及第二局的中盘认输之后，在今天的第三局比赛中，柯洁全场被压制，虽然中途放手一搏挽回一些局面，无奈AlphaGo太稳健，最终“安乐死”。

其实早在比赛开始一个小时左右，棋圣聂卫平就表示，执黑棋的AlphaGo已经赢了，可以收子了。聂卫平还表示，AlphaGo的棋力非常高，已经完全超越了人类，虽然目前人类职业棋手的最高段位是九段，但AlphaGo至少达到了二十段。这是不是意味着，在围棋这件事上，人类几乎再无可能超越AlphaGo？

AlphaGo现在到底有多强？

按聂卫平关于二十段的说法，作为并不懂围棋的小编而言，总觉得太过夸张，总体来说，也不太容易理解。还好，DeepMind创始人兼CEO Demis Hassabis和首席科学家David Silver在中国乌镇·人工智能高峰论坛做出了更通俗的解释。

从AlphaGo挑战人类开始，针对不同的阶段，David Slver表示，DeepMind团队给AlphaGo确定了三个版本的名称：AlphaGo Fan（与樊麾对弈的版本）、AlphaGo Lee（与李世乭对弈的版本）、AlphaGo Master（驱动Master的版本）。他们三者之间最主要的差别就是棋艺水平，Google现场也展示了三者的围棋ELO等级分：

AlphaGo至少已经达到二十段，人类还有机会吗？

从图中可以看出，2015年10月登场的AlphaGo Fan等级分大约在2900分左右，2016年3月登场的AlphaGo Lee等级分大约在3700分左右（李世乭本人目前3530分），今年年初登场的AlphaGo Master等级分已经来到了4800分左右。而目前世界第一人柯洁的等级分也仅有3625分而已。对于AlphaGo Lee与AlphaGo Master之间的差距，Google认为大约在让3子左右。

而柯洁在得知这个差距之后，却彻底不淡定了，并发布微博称是一个可怕的对手：

AlphaGo至少已经达到二十段，人类还有机会吗？

值得注意的是，等级分的数值实际上是由一系列比赛中的胜负来确定的，这个数值在输赢都存在的情况下比较准确（高低都有参考值）。而AlphaGo Master之前一举面对职业围棋人士连胜60盘，等级分很可能还远没有达到真实的水平（上未封顶）。

人类还有机会？

微软亚洲研究院资深研究员郑宇博士认为，AlphaGo的综合实力目前走在了人类的前面，但并没有完全攻克围棋这项运动。

一方面，能通过短短几个星期的学习就能击败学棋二十多年的顶尖围棋选手，已经证明了人工智能的强大。因此，即便AlphaGo日后万一输了，我们也仍然应该为人工智能点赞，切不可再次否定人工智能的力量。

另一方面，AlphaGo采用这样的技术线路其实是根据人类自身对围棋的理解来设计的，即搜索+价值评判。也就是说我们先假设各种走法（执行下去），再评判这样走可能赢的机会大小。由于索搜空间巨大，即便用尽地球上所有的资源，也不能找到最优解。此时，在某个局面下对（未来输赢）价值的判断就变得尤其重要。在深度学习没有出现之前，这点一直是机器的弱项，因此，早年间人在这方面占有巨大优势。

从专业的角度来讲，AlphaGo用深度学习去逼近了一个价值判断函数，然后再跟蒙特卡洛搜索树结合的方法。这个近似解比目前人类的价值判断（可能）接近或者要略强一些，加上机器不知疲倦的搜索效率和无情感波动，综合来看走在了人的前面。

但AlphaGo得到的这个解远不是最优解法，围棋未来可探索的空间还很大，还没有被攻克。

同时，人类也在不断进步，人类后天的快速（小样本）学习能力是AlphaGo基于现在的学习方法还做不到的。短期来看人类获胜的概率小，但长远来看（未来5—10年）人类还有机会，可以从少量跟AlphaGo对弈的棋局中快速学习，尤其是在价值判断这块，人和机器人都还没有弄明白怎么回事，在没有明确的规则时，人相对于机器还有机会。

如果还是基于现有的学习体系，即便再给AlphaGo一亿副棋谱，再添加一万块GPU，它进步的速度也终将放缓，因为新增的棋谱和计算资源相对于2*10171这个搜索空间来说只是沧海一粟。

现在人类跟AlphaGo处在一个信息不对称的局面。人类跟AlphaGo对弈的次数还太少，获得的信息反馈也还远远不够。如果能够把AlphaGo开放出来，让更多的职业高手跟它对弈，让年轻的棋手来学习它的下法和招数，相信人类棋手也能够从中学习到很多，从而再次进步。

AlphaGo要“退役”？

当人类正在考虑通过跟AlphaGo的更多对弈来寻找到超越的机会时，我们却听到了一个“坏”消息，在今天柯洁跟AlphaGo的最后一局比赛结束后的发布会上，AlphaGo之父、DeepMind创始人戴密斯·哈萨比斯（Demis Hassabis）说：“本周的比赛聚集了围棋起源地最优秀的棋手参与，是AlphaGo作为一个竞赛系统能够对弈的最高级别对手。因此，本次中国乌镇围棋峰会是AlphaGo参加的最后对弈比赛。”换句话说，AlphaGo被宣布“退役”了，以后可能都不再跟人类棋手进行比赛。

哈萨比斯解释了为何做出这样的决定，他说：“周二（5月23日）来的比赛超出了我们的期望，我们见证了天才柯洁把阿尔法狗推向了极限，比赛也异常精彩。此次的配对赛和团体赛也为我们开创了新的天地，这种类型的比赛与合作都是史上第一次。AlphaGo和我们的团队都学到了很多。这种比赛展现了AI的最高水平，让人类挖掘了AI作为工具的潜力，从而帮助人类拓展新的知识领域、发现真相。”

不过，哈萨比斯宣布，人类棋手与AlphaGo的故事并不会就此结束。AlphaGo的启蒙老师、欧洲围棋冠军樊麾随后表示：“AlphaGo团队将与柯洁合作，对此次的棋局进行分析，根据AlphaGo内部的数据，与柯洁研究此次的对局，展现比赛的过程并做成视频，与全世界的围棋爱好者共同分享。AlphaGo团队还为全球围棋爱好者准备了一份礼物。AlphaGo在于李世石比赛后，进行了成千上万的自我对战。这些自我对战是AlphaGo最宝贵的财富，我们近期会公布50盘阿尔法狗自我对战的棋局。这些自我对战都是以慢棋的形式体现出来。”

据樊麾介绍，现在大众已经可以在DeepMind官网上下载10盘AlphaGo自站对局，以后每天会更新10盘新的对局。

此前，马云曾发表评论认为，AlphaGo的出现让围棋失去了乐趣，但是棋圣聂卫平并不这么认为。AlphaGo 的出现，就像鲶鱼一样刺激人类棋手进一步提升。然而，随着AlphaGo 的“退役”，人类恐怕再无机会在围棋上战胜它了，其他AI棋手还会给人类机会吗？

关键词：AlphaGo

AlphaGo至少已经达到二十段，人类还有机会吗？

免责声明

联系我们

隐私声明