-
陈经:感谢李世石生命般的抗争 现在我敢说AlphaGo的命门其实很简单
关键字: 人机大战人机大战第五局AlphaGo的命门AlphaGo的BUG李世石大战AlphaGO陈经谈围棋人机大战2016年3月13日,人机大战第四局李世石执白180手中盘胜AlphaGo。说这一胜是人类历史上最重要的一胜也不为过,就不多说了。从围棋技术与算法上来说,最重要的意义是,我们终于看到了一张AlphaGo的败局谱,明确知道AlphaGo有重大bug,前三局过后看似威力无比的机器,发起疯狗症竟然会走出那么可笑的招法。
现在终于知道,为什么谷歌只公布了与樊麾的五盘正式对局的棋谱,却不公布非正式对局里二盘败局的棋谱。哪怕一盘败局的全谱泄露出来,人类稍作调查就会知道如何对付它。李世石接到谷歌的邀请,只考虑3分钟没提什么条件就应战了。从人类与机器斗争的角度看,这真不折不扣是《三体》中描述的有碍于人类生存的“傲慢”。不夸张地说,只要李世石要求谷歌公布一张AlphaGo的败局谱,这次人机大战的胜利者就非常可能改写。但也不能怪李世石,估计所有职业棋手都想不到,这是人类的共性。我们要感谢李世石,终于用生命一般的抗争在第四局逼出了真相。
1996年国际象棋第一次人机大战,卡斯帕罗夫就谨慎得多。他提出先由助手和IBM的机器下测试棋,正式比赛时卡斯帕罗夫以4:2获胜。这是因为国际象棋程序当时已经发展多年,显示了不低的实力。而围棋程序也是发展了多年,虽然取得了几次重大进步,人的感觉仍然是职业棋手让五六子的水平。樊麾的失利是一个重要信 号,但从人类情绪来看,越是不懂围棋技术的人越敢预测机器的胜利。棋迷与职业棋手更了解自己这边的“强大实力”,更了解围棋作为一个算法问题的复杂度,傲慢没有减少。
第四局李世石获胜的关键,赛前我就在上一篇文章中作出了非常接近实战进程的预测:开放式接触战,利用机器“不喜欢打劫”的特性,让机器犯昏。
李世石这第78手在人类看来,其实还是有漏洞的,仔细拆解会发现这并不是最佳着手,黑棋应对了白不行。但是这招非常神奇地引发了机器的bug。为什么会有bug,难有定论,我认为最可能是AlphaGo的价值网络出问题了。(观察者注:关于AlphaGo的价值网络,田渊栋的这篇《AlphaGo的分析》做了很好的科普,作者为前谷歌工程师,Facebook智能围棋 darkforest 的负责人和第一作者)
如图至第82手。80和82都是必然的,所以叫78为神之一手。其实AlphaGo这时走B位,据职业棋手分析,空里没有什么棋。如果白M13扑,黑可以 提掉78一子,白L13再打吃,黑粘在78位。下面白吃不掉63这个子。对人来说变化并不复杂。观战棋手猜测李世石预想的变化图是这样的:
如果AlphaGo走1位,那白只好2位先手接回一子,再4位先手切断,在外面做出一片形势,局势还能维持。
而AlphaGo却走了实战的83手,后面一连串招法都特别糊涂的样。所以犯错是从83手开始的。Deepmind负责人哈萨比斯说从79到85手,机器都以为自己胜率高达70%,到第87手才发现不对劲,一步棋评分就急剧下降了。降到多少没有说,但肯定是个很低的分,所以才后面一连串搞笑的棋。这些搞笑的棋本身到是不难解释,为了偷得可怜的一点胜率,它觉得别的招都不如你打吃看不见。Zen之类的MCTS程序落后了乱下很常见。我们要解释,为什么AlphaGo下了错误的83。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:张红日
-
荷兰大臣承认:没想到中方反击这么狠,措手不及 评论 19
去中国科学城一看,英诺奖得主长叹一声… 评论 33
欧盟又担忧了,“小心美国成为下一个中国” 评论 58
又自吹,“没通知中美欧,做得对” 评论 111
警惕!美国新版“国安战略”8次提及台湾 评论 34最新闻 Hot-
欧盟又担忧了,“小心美国成为下一个中国”
-
前东京都知事再批高市:赶紧撤回,特朗普不会为日本出手
-
笑死…诺奖没要到,特朗普拿了个国际足联和平奖
-
只字未提朝鲜,“因为特朗普想和他见面…”
-
日本政府计划在明年7月成立“国家情报局”
-
又自吹,“没通知中美欧,做得对”
-
警惕!美国新版“国安战略”8次提及台湾
-
交通运输部:坚决拥护党中央对费东斌的处分决定
-
协议签了,两国总统手都没握,特朗普撮合的就这?
-
“轻松的一天”,随行高管们非常期待…
-
“特朗普对高市早苗措辞非常严厉,甚至还说了……”
-
扎心了!美新版国安战略,辣评欧洲
-
东南亚多国表态,“缅甸措辞最严,坚定站队中方”
-
打造美版深圳!他给特朗普画饼,被曝“近乎科幻”
-
无视美国,莫迪宣布:印俄已同意…
-
“二次打击”还没解释清,美军袭击又致4死
-

观察员
上海市互联网违法与不良信息举报中心