-
陈经:即使AlphaGo不出来下棋,我们还有绝艺
关键字: 绝艺人工智能AIMasterAlphaGo局面评估柯洁和Master一出来就天下无敌不同,绝艺有着明显的棋力上升轨迹,经过数次下线开发升级。Master忽然出来对高手们排队密集敲闷棍,能提升神秘感,但未免显得重保密、轻交流,是围棋局外人的做法。AlphaGo的开发思想是,棋力提升靠人类棋谱以及海量自我对局就可以了,不需要真和人下。和人类高手对战,只是确认机器的棋力,不是用来提升机器实力,也不是帮高手涨棋。
而绝艺却明显走了另外一个技术路线,积极和人类高手对战。无论是胜多还是败多,尽量从中发现问题,快速解决后又出来下棋,循环开发。这个路线显然更为亲民,也给高手们更多观察的机会,自身弱点暴露得更充分,神秘感不多。如果以后绝艺有机会与AlphaGo进行“机机大战”,它将以“围棋界自己人”的身份,与“局外人”AlphaGo对战,而且感觉这一天的到来并不遥远。我肯定希望绝艺获胜,相信这也是多数棋界人士的愿望。
此前从未有这样高水平的AI与高手们持续作战数月,绝艺清晰的战绩轨迹,有助于我们理解围棋AI的特性,甚至人类高手自己的特性,也可以让我们对Master的无敌战绩加深理解。
绝艺最初打出名头,是靠20秒的快棋。这是高手们在弈城、野狐等网站上练习时的标准时间配置,三次20秒读秒。高手们认为20秒时间足够思考了,绝大多数棋都在20秒内下出,关键时候才会用掉一次读秒。有的高手甚至认为20秒长了,下15秒甚至10秒的快棋。棋手们普遍认为自己快棋水平不比慢棋差多少,就差一先,有的甚至感觉实力差不多。孟泰龄在下棋的同时还能清楚地录制解说,大多数是20秒的对局,中间还跑去收快递盒饭。高手们20秒对战搞得有模有样,有时还战得很精彩。
但是绝艺的20秒,早在2016年12月高手们就挡不住了,基本可以肯定不是绝艺的对手,硬来就是朴廷桓式的五连败。绝艺证明了高手们的20秒是充满了错误的低质量对局。中国棋院院长王汝南说:“腾讯搞的人工智能围棋,20秒一步,职业高手们不好对付”,就是这个意思。
20秒还是更长时间,对绝艺以及Master的棋力毫无影响,因为它们都会在10秒内出手没有区别。但是对人类来说,20秒是绝对不够用的,真正能用于思考的时间很少。对方落子以后,人先要理解对方下的棋。预料之中的可能花个2秒就够了,出乎预料的,就要花更长时间去建立棋感。20秒的棋,到10秒就开始有读秒声,其实并不能怎么专注思考,一不小心就要超时,需要早点想好招确认。真正有效思考推理的时间可能就是10秒左右,推不了多深,多半是凭感觉拍。之所以下得有模有样,是因为下套路棋很熟。套路完了,后面会犯很多错。
但双方水平差不多用时都不够,出错未必能抓住,抓住了下一个局面又送回去,概率性地互相翻盘,围观的人也没时间发现这些错误。即使是网棋水平最高的柯洁、朴廷桓、范廷钰等人,也不过是七成胜率,经常犯错,水平高主要体现在胜率高一些。有时说不清是棋更熟,还是真的对围棋理解更深。20秒的对局,主要培养的是棋感,以及快速计算的能力,但计算的深度广度就谈不上了,本质上是和业余棋手差不多的“感觉行棋”。业余棋手是没有计算的能力,高手们下20秒就是主动搞极限运动了。
高手们面对绝艺,这个弱点暴露无疑。绝艺不用Master那么高水平,但是发挥也足够稳定,不会出简单的错招。高手们顿时显得压力极大,一出明显的错招一局可能就断送了,而绝艺会毫不留情地抓住,“感觉行棋”明显不行。绝艺虽然下得更快,但是计算机出身速度是本行,每招的计算都可以保证基本的水准。
2016年12月开始,绝艺主要和高手们下30秒的快棋。多出来的10秒时间很关键,相当于实质思考时间翻倍还多,时间多了心态也会好,能够进行一些稳定计算了。高手们30秒的实力相比20秒明显提高,在“感觉行棋”上也加入了相当多的计算验证,能够设计一些手段。这一段时间,柯洁对绝艺战绩明显占优,曾连续获胜,显得对付AI很有办法,高手们也经常能杀掉绝艺的大龙或者吃掉局部一块棋获胜。绝艺的弱点也暴露出来,局部死活搞不清,大龙的死活掉以轻心。柯洁在野狐看棋时透露了对付绝艺的心得:做大模样,等它进来犯错。
春节期间,绝艺也过年去了。假期结束后,绝艺似乎修复bug得力,棋力明显上升,对高手们30秒战绩提升明显。从2 月14日开始到3月5日,柯洁对绝艺惨遭13连败,对局时心态明显变异,经常很快就输掉了。这也可能是柯洁在试一些特殊招法,但绝艺对高手们的30秒战绩显然是压倒性的。绝艺的进步,让高手们的30秒又显得时间不够了。
看到绝艺的出色战绩,可能是出于宣传目的,野狐适时地推出了升10段的规则。
成为10段后,绝艺又与高手们下了一阵子30秒,仍然是9成胜率。因此3月5日之后,绝艺与高手们都是下60秒的对局。每步棋60秒,这给高手们相当大的时间自由,能够进行的思考要深入多了。在高手们的正式对局中,这是常见的情形。有些喜欢长考的高手早早进入1分钟读秒,但面对时间充裕的对手一直能顶住,对局质量很高。
60秒的棋,人类高手算是拿出真本事和AI对局了。Master的60连胜基本是20、30秒的,只有对聂卫平给了60秒。面对Master的不拘一格的新手,高手们根本没有时间反应,往往一个局部就吃大亏,整局再无机会。看到新手,心里本来就有压力,又只有30秒,还不知道对手要干啥。应对的选择会有几个,根本没时间细算,连感觉一下时间都不够,多半是胡乱蒙一招了,很容易吃亏。
Master对人类高手的压迫主要就是两个,一是时间攻势,二是新手攻势。事实证明,几乎没有高手能顶住。我认为人类高手输得其实有些冤,因为平时正式对局有1-3个小时思考时间,Master式的新手肯定出现在开局,人类高手会有充足时间去仔细琢磨,不可能象网上对局这样20、30秒就得下。人类高手正式对局也不时下出新手,但对方一看是新手,就会仔细琢磨,一般能找出妥善应对,很少被新手击溃。如果也是20、30秒就被逼下子,新手多半会很成功。
可以承认Master的思维方式和人类高手不一样,把围棋布局与局面评估艺术带到了人类高手不曾想到的新境界。在职业棋手开局严重套路化千篇一律之时,这一股新风无比珍贵。但是不能说Master的新手,或者截然不同的布局风格,人类就无法应对。如果给人类高手多一些时间应对新手,同时主观上提升对布局的思考,不再机械地摆“常形”,那么人的表现会好得多。不说战胜Master,至少能逼出Master更多本事。现在Master就靠“新思维”,在布局阶段就打败了人类高手,这是很遗憾的。因为这是人类的思考时间不够,太可惜了。如果能看到Master在复杂死活、复杂劫争、大对杀、耍大龙等局面的表现,无疑会更为精彩,这也是围棋艺术必不可少的精华。
如果再大胆一点,或者说为了人类棋手鼓劲,可以提出一个猜想:
AlphaGo比人类主要强在思考速度快、布局理念创新、局面评估准确、水平稳定。但是一些复杂死活、复杂劫争、大对杀局面,AI搜索算法有本质困难,人类却能发挥逻辑推理的优势,比AI表现更好。可能的情况是,AlphaGo团队尚未给出解决复杂死活、复杂劫争、大对杀问题的可信算法,但把局面评估上的优势做到远超人类的程度(还通过把对局时间限制在20、30秒极度放大了这些优势),成功掩盖了这些弱点。
而绝艺和高手们60秒对局的表现,似乎能对这个猜想提供一些证据。60秒对局,绝艺的胜率从30秒时的90%下降到60-70%,经常连输。相当于人类高手的胜率从10%升到了30%-40%,胜局数增加两三倍,表现大为好转。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:武守哲
-
布林肯来华谈的怎么样?是否不虚此行? 评论 100“看看,这就是美国的警察” 评论 364习近平会见布林肯:中美应彼此成就,而不是互相伤害 评论 130“宁愿关闭在美业务也不卖” 评论 397王毅见布林肯,对美方提出三个“不要” 评论 264最新闻 Hot