-
陈经:再次对决AlphaGo,柯洁的胜算有多大
关键字: AlphaGo人工智能围棋柯洁AI人机大战【文/观察者网专栏作者 陈经】
酝酿了近一年的二次人机大战终于有了正式消息。4月10日,谷歌与中国棋院宣布,2017年5月23日起,AlphaGo将与柯洁进行三番棋对决。胜者奖金150万美元,负者出场费也高达30万美元,是围棋比赛有史以来的最高奖金。
一、胜一盘的重要性
然而,150万美元奖金虽高却像画饼,几乎没人相信柯洁能胜两盘获得比赛的胜利。但这不是钱的事,只要柯洁胜一盘,就能封神了。
这次比赛会下满三盘,古力说柯洁只有10%的机会胜一盘,还可能乐观了。一些资深棋迷打赌开的赔率也是柯洁胜一盘赔10倍。这相当于说,柯洁和AlphaGo下,30盘才能胜一盘。
棋界现在一种说法是,AI战胜人类带来围棋技术的大发展,人类学习AI与AI共同进步。这算是呼应谷歌团队的姿态,说棋艺有大发展、学习AI,这都没问题。但围棋首先是个胜负的游戏,对职业棋手来说,胜负压倒一切。围棋和国际象棋、中国象棋不一样,和棋极少,输半目也是输,更残酷。现在不能认怂,还是应该争取战胜AlphaGo,只胜一盘意义都大于这150万美元的奖金。我相信,如果柯洁能胜AlphaGo一盘,倒贴钱他都愿意。柯洁自己也是斗志满满,在央视《朗读者》上读哈里波特,把AlphaGo比作伏地魔,声称要“零封AlphaGo”。
柯洁参加《朗读者》,阅读《哈利波特》
去年李世石以1:4惨负AlphaGo,震动了棋界甚至整个世界,引发了人工智能热潮。《自然》与《科学》都将这个事件列为年度八大、十大科技进展。对外界来说,1:4和0:5似乎区别不大,对棋界就不一样了。如果没有这一胜,棋手们面对AlphaGo将极度自卑,只剩下各种恐惧与膜拜。去年人机战第三盘AlphaGo序盘碾压李世石,以3:0胜出比赛的时候,棋界气氛极度压抑,几乎没人再对李世石抱有希望。直到第四盘李世石胜出,棋手们才恍然大悟,原来AlphaGo的命门是计算!整个棋界大缓了一口气。李世石说,这一胜拿什么也不换,意义真有这么大。
去年正因为我深深知道人类胜局的重大意义,才在几乎所有人都绝望的时候,仍然坚持分析AlphaGo的弱点,还真预测到了李世石胜出的方式。
Master年初60:0碾压人类高手,现在棋界的气氛又和去年3:0时差不多了。某种程度甚至更为绝望,因为这回盘数很多有说服力。而且能战胜人类的AI不只AlphaGo了,还有绝艺和DeepZenGo。好消息是有职业实力的AI只有这三个,坏消息是连最弱的DeepZenGo都不好对付。
3月18至19日的计算机围棋UEC杯,绝艺在预赛和决赛中两胜DeepZenGo,AI界的老二老三座次排定。紧接着3月21至23日的首届世界围棋最强战中,老三DeepZenGo代表AI与中日韩三大高手下了三局每方三小时的慢棋,一局完胜两局憾负,前半盘都是明显领先。3月26日UEC杯的后续节目电圣战,绝艺与DeepZenGo都表现上佳击溃日本新锐一力辽。在野狐围棋网,绝艺实力不断进步,在快棋中对人类高手胜率高达9成,并以碾压态势率先升为10段。柯洁对绝艺13连败,已经1个月没有公开和绝艺下了。如果人类连绝艺和DeepZenGo都打不过,那还怎么和AlphaGo较量?
二、正确认识AlphaGo,消除恐惧
人类棋手的误区是,总是不由自主把围棋AI当作人来看待,首先根据战绩判断AI的实力,其次看棋谱。以前看棋谱觉得AlphaGo实力不强,李世石100万美元奖金天上掉馅饼。AlphaGo3:0胜出的时候,又觉得AlphaGo不可战胜了,要让二子。李世石胜了一盘,又觉得原来AI有弱点,畏惧心理消除。AlphaGo升级为Master下得又快又好创新很多,又觉得它深不可测,不可战胜了。看DeepZenGo网上战绩,高手们评价不太高,但从最强战三局慢棋实战表现来看是低估了它。只有绝艺一直和高手们亲密接触,甚至有能悔棋的内测版,开发人员中也有罗洗河这个世界冠军,所以棋手们了解多些。
围棋AI是程序,思维和人截然不同,不能象观察人那样去想象它的能力。它强的地方,不要低估,它弱的地方,也不要高估。除了战绩、棋谱这些摆在明面上的信息,更值得分析的是AI的算法。应该从算法原理去分析,围棋AI为什么强,为什么弱,结合实战表现,做出合理的解释与猜想。现在棋界一大问题是对AlphaGo太过惧怕,不少职业棋手对Master可以说是吓死的,招法完全变形,序盘就败了。不了解对手,对手下的招出乎预料就害怕傻眼了,时间压力之下失去正常思维,这根本没法下棋了。
棋界迫切需要尽量了解AlphaGo,对它的行为模式建立预期,消除恐惧。Master的60局棋谱,棋手们研究一段时间了,有了相当的认识。由于谷歌的保密风格,算法上AlphaGo有什么重大进展信息极少,但也还是有一些可以分析的,本文会从算法角度进行推测。
我的结论是,AlphaGo是个“围地大师”、“创新大师”,但并不是“战斗大师”,棋艺从原理上就存在短板,但是特长极强,掩盖了弱点。柯洁仅仅是消除畏惧心理,恢复平常心是不够的,这还是传统思维模式,也不一定做得到。人类高手不能空喊“有信心”之类的口号,需要从理性上确立“获胜是可以做到的”这个信念,根据AlphaGo的算法特点,改变传统思维模式,针锋相对与它战斗,争取在人机战中获得胜利突破。柯洁在人类棋手中思维活跃、搅功无敌,是战胜AlphaGo的最好人选。希望柯洁采用正确战术,取得一胜。只要一胜,二次人机大战就会成为棋手与棋迷的狂欢节。
特别有帮助的是,腾讯开发的绝艺达到了极高水平,柯洁和绝艺极为开放的内测版下,可以反复实践演练自己的想法,并不是闷头准备。腾讯开发围棋AI的团队就有三个,绝艺只是胜出的那个,这个投入确实很有魄力,如果柯洁能打破AlphaGo的坚冰,棋界要感谢腾讯。
由于绝艺不断在野狐围棋网上下,虽然胜率不断提高,但还是经常输给职业高手,所以人们可能低估了它的实力。绝艺输主要是出bug,表现正常的时候实力极为可怕,而且在快速进步,要看最近的胜率。业余六段和职业棋手也就是让先到二子的差距,据说有业六让四子和绝艺下20分钟的慢棋还是输了。绝艺的棋风和AlphaGo不同,创新不多,但是力量太大了,出手很敏锐。4月10日开始绝艺在野狐复出下棋每天两盘,是20分钟和三次1分钟读秒的慢棋。到4月14日,对10位职业高手取得了9胜1负的战绩。
通过和绝艺的不断对局,人类高手已经相信,自己正常1分钟读秒的表现会比20、30秒好得多,对绝艺胜率明显提高(指以前版本,绝艺最新版本又进步了)。AI对手和人不是一回事,人类下快棋对AI实力会大降。如果现在的绝艺和人类高手下20秒、30秒的快棋,再加上人类高手不了解它,如果它还新手不断,杀个60:0不是不可想象。有了绝艺这个参照物,年初Master的表现也就不是这么震憾了。绝艺虽然在快速进步,但人类高手由于看着它成长的,和它下思维比较正常,表现要好得多。
我这并不是心灵鸡汤式的给人类围棋高手打气。如果是国际象棋,从算法原理上就知道,人类不可能战胜AI。国际象棋AI和人下棋的思路差不多,算得比人深远,无论是局势评估还是推理搜索,人会的AI全会,还更厉害。国际象棋AI能下出人类无法想象的“AI”棋,人类确实没理由战胜AI。但围棋是另一种游戏,不仅复杂得多,特点还完全不同。AI和人是用两种截然不同的思维模式下围棋,AI学会了人的部分本事,还发展出了新的本事,在局势评估上远远强于人。但是人也有AI不会的绝招,就是复杂战斗、对杀、死活、精确收官等以推理为基础的围棋技术,由于AI没有概念推理的能力,这些任务对AI算法来说很困难。
相当于人和汽车的赛跑比赛,如果是一条平路,汽车必然战胜人。如果路上有的地方有墙,有的地方有沟,人会翻墙也会下到沟里再上来,而汽车翻墙过沟不太会,可能会翻车输给人。人如果选择在平路和汽车比拼,那当然必输;如果把比赛引向翻墙过沟的比拼,不仅比赛有趣多了,还真可以获胜。比赛之前人制定战术的时候,不能说要平常心,要学习汽车的高速度争取跑出博尔特的水平,那也是输。为了胜利就应该扬长避短,跑步也要会,不要跑步就把腿折了退赛。速度落后于汽车不要惊慌,如果能把汽车引向有墙有沟的路段,就能等到时机。
当然AlphaGo的能力很强,很难把它引向表现差的路段,这只是一个比喻。但可以肯定AlphaGo不是全能的,从算法原理上就有漏洞。最高水平的国际象棋AI互相比赛绝大多数是平局。两个AlphaGo自我对局总是能分出胜负,也不是每局都差距很小。这中间肯定有大量的局面,在算法的能力之外,AlphaGo执黑或执白随机地出错。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:小婷
-
以色列“有限复仇”:选在了伊朗核计划中心 评论 281以色列“报复”开始:伊朗多地传出爆炸声 评论 5805.3%,一季度“开门红”能转化为“全年红”吗? 评论 140“以色列精心策划俩月,但严重低估了伊朗反应” 评论 120美国胁迫下,阿斯麦CEO最新涉华表态 评论 232最新闻 Hot
-
以色列“有限复仇”:选在了伊朗核计划中心
-
5.3%,一季度“开门红”能转化为“全年红”吗?
-
两大家族开撕?菲第一夫人公开指责副总统:不道歉,这事就没完
-
美国一票否决,多方回应
-
李迅雷:发展服务业与做强制造业不矛盾,可参照德国、日本
-
欧盟跟着泼脏水:中国不仅坐山观虎斗,还下场了
-
美国积极促成沙以和好,“可以限制中国”
-
“这是拜登政府首次挑起加税,中方反制不会手软”
-
“预计今年将推出一揽子政策,旨在解决问题而非刺激经济”
-
美以私下做了个交易?美方紧急撇清
-
特朗普变口风:乌克兰的存亡对美国很重要,欧洲麻利点
-
“未来几年,这是各方关注中国市场的一个重要指标”
-
应韩企要求,美国拟恢复一项涉华关税
-
菲律宾“倒打一耙”
-
“以色列精心策划俩月,但严重低估了伊朗反应”
-
“你们愿意中国提前登月?不愿意?那就打钱”
-