-
陈经:再次对决AlphaGo,柯洁的胜算有多大
关键字: AlphaGo人工智能围棋柯洁AI人机大战人类棋手也发展出不少围地理论,布局理论一度非常流行,甚至被认为是最高级的棋艺。中国国家队曾长期学习日本,集体研究大局观,说收官与战斗自己研究就行。但是世界棋坛的发展却出乎预料,高手们走向了暴力围棋。这是因为人类棋手眼中的大局观,琢磨到后来就说不清楚了,高手复盘时经常意见不统一。低手大局观提升变高手可以,高手再怎么提高就不知道了。后来甚至以为围棋布局也就这回事,再怎么琢磨也占不了多大便宜,随便下下就行了,中后盘决战才是王道。而且实战也确实如此,没有哪个棋手布局优势突出,都是拼中后盘。
直到围棋AI出现,人们才明白,原来布局方向选择比想象的还要重要。不仅是AlphaGo,人们眼中实力并不太强的DeepZenGo大局观都很好。最强战三场比赛,芈昱廷、朴廷桓、井山裕太大局上都落后于DeepZenGo。如果和AI比大局观,比围地,人类棋手连DeepZenGo都战胜不了。我和唐韦星九段一起在腾讯直播解说了DeepZenGo和一力辽的比赛,DeepZenGo虽然下得很快,但大局观还是明显比一力辽强。绝艺的大局观应该和DeepZenGo类似,并不强太多,UEC杯决赛对DeepZenGo直到120手胜率还是0.5不占优。AlphaGo由于有创新,大局观又要强很多。
人类选手在大局观上面对绝艺和DeepZenGo已经占不到便宜,甚至会吃点亏,但还没到被碾压的程度,后面可以等机会翻盘。高手们面对Master可以说布局阶段就明显吃大亏,从来没碰到过这样的对手,一时不知道怎么办了。首先用时策略就得改。
人类高手和AI下的时候,从围棋技术角度还以为是和人下,但又知道对手是AI心态扭曲,表现甚至更差。和人下,会感觉布局并不是太重要,20秒、30秒双方下得有模有样。谁也没有很厉害的大局功夫,有人稍强点也有限。用时分配上就明显有倾向,布局阶段往往下得快,感觉差不多就下了。不是说没时间思考,习惯上就不觉得能想多少,没什么好想的秒下算了。有时碰上新手才用多些时间应对。到中盘战斗与收官“复杂”起来,才开始习惯性长考,有人甚至认为长考说明局势困难。
这个用时策略对付绝艺或者DeepZenGo可能还行,吃亏不太大后面总有机会。对付Master就不行了,感觉行棋布局肯定顶不住。由于Master对人60:0都是网棋,每手20秒或者30秒,人类高手被迫用错误的时间策略和它下,输这么惨这是很重要一个因素,Master的棋力优势放大了很多。这次柯洁对战AlphaGo是3小时思考时间,五人相谈棋是2个半小时,一定要注意把时间花在序盘布局。1分钟读秒的紧棋高手们有经验,宁肯进入中后盘读秒下,也不要序盘下快了莫明其妙吃大亏。
其实人类高手布局水平也不是说差到被Master碾压的程度,仔细思考表现会好得多。如果思考时先存了一个“布局不要吃大亏”的想法,一些行棋方向判断仔细体会,肯定可以提高。Master的60局中一些创新,体现了一些布局新思想,隐约有“全局关联”行棋的感觉,远处几个子不一样,焦点处的选择就不一样。Master并不是靠惊天妙手在局部击溃高手们,更多是在平平淡淡的局面选择中体现功力,有不少反直觉的招法,仔细体会是成立的。从算法角度,这些新招是可以解释的,就是价值网络的贡献,突破了人类策略网络的成见,不要看得太神秘。多挖掘分析Master在60局中领先的原因,有助于人类高手在布局阶段顶住。一些棋手已经在正式对局中模仿Master的下法,但不少棋手都说如果没有理解盲目模仿并没有好处,这是对的。要下功夫去理解这些棋谱。
2016年12月29日,Master执黑胜於之莹
这是Master对於之莹的对局,黑23、25捞地,白26封住,好象是很自然的招法。但是黑27不好应付。白的棋形出现弱点,为了防断,只好28和30位补强自身。这时黑31拆就显得价值极大了。Master的棋经常有这种表现,它捞地,人类对手自以为外面是厚势。但是再来几招就发现,对手的厚势Master有几个子远远的限制着,还有几个子贴着很讨厌,厚势变孤棋甚至被吃都可能。后来白这团“厚势”确实被吃了。
2016年12月31日,Master执黑胜朴廷桓
这个局面也类似,Master连爬二路,4目做活,看上去很委曲。但是仔细看,黑上面一块已经是带眼铁活的厚势,黑所得不小。而白三路连压这一串,说是厚势,其实没有眼,黑棋再来一两手,这块棋就得忙做活了。而且白这块“厚势”没有发展了,下面四个黑子远远地限制着,白也没有手段借这块厚势打入黑下面大搞破坏。
这类局面Master得心应手,而人类棋手即使在局面形成后能明白,前面也习惯性地行棋。如“压对手爬二路真爽”,“封住再说”,“外面打一下不亏”,“分断总是对的”。这些其实都不是绝对真理,需要继续推更多步来判断。曾经日本棋手面对中韩棋手有理说不清,战斗起来被暴打。其实就是感觉行棋,以为棋形正就对了。日本前辈总结说,中韩棋手先不管棋形,不靠感觉判断,而是往下摆,摆出结果自然就说明问题了。同样的错误,现在人类棋手面对AI布局时也在犯。人类布局就靠感觉,有时根据一些“格言”秒拍,或者粗粗看下就觉得可行。其实有些后续招法有必然性,能往后推不少步,再来判断感觉可能就不一样了。布局时不能一味讲究“棋形”、“经验”。哪怕就按人类下棋时的思维方法,也可以往后多推一些,再小心地进行局面判断,有时是能纠正一些错觉的。
布局时什么时候要小心,其实也不是完全没迹象。如果子都在近前,人自然知道要小心推理,局部结果都受影响了。就是有些子远远的放着,人容易掉以轻心,只看局部。其实推多些步以后,这些远远的子就关联上了,有时甚至能直接参与战斗,更常见是能影响局部结果评估。可能Master的价值网络也并不是多神奇,只是天生就是全局思维,从来不会只看局部,对这些全局微妙的地方体会深,不会产生错误的局部“格言”。人类也要这样全局思维。虽然一时难以做到很好,但和AlphaGo对战布局时改变一下思维模式,提醒自己多进行布局分析,应该是可以的。
这需要改变平时网上拍快棋的习惯。年青高手特别喜欢在网上拍快棋,20秒都觉得慢了,经常下15秒的。这是能锻炼棋感,但这么快下出来形成的往往只是局部的棋感。要从全局出发培养棋感,需要多下慢棋,在慢棋中仔细体会全局配置。起码要有了全局思维的习惯,再去下拍快棋。高手们细心体会Master的全局思维,布局水平一定会有很大进步。如果全局思维上取得进步,虽然从原理上还是没法胜过AlphaGo,和它对局时莫明其妙吃大亏的机会就小多了。这其实是人类和AlphaGo目前差距最大的地方,也是人可以主动努力提高的方向。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:小婷
-
以色列警告美国:一旦逮捕令下发,我们就对它动手 评论 99涉及俄罗斯,美国又对中企下黑手 评论 224内塔尼亚胡警告布林肯:以色列不会接受 评论 117“这是美国自信心下降的表现” 评论 153“美国没料到遇上中国这样的对手,出现战略失误” 评论 300最新闻 Hot