陈经：感谢AlphaGo对围棋的贡献，人机缠斗刚刚开始

APP下载

扫一扫

下载观察者APP

陈经：感谢AlphaGo对围棋的贡献，人机缠斗刚刚开始
- 陈经风云学会会员，《中国的官办经济》
分享到：

2016-03-17 07:51:01 字号：A- A A+ 来源：观察者网

最后更新: 2026-06-10 15:19:35

2016年3月15日人机大战第五盘，AlphaGo执白280手中盘胜李世石，总比分4:1结束了这场持续一周的围棋盛事。

我在广州爱范儿公司和吴肇毅九段一起直播了这场比赛，感觉对机器的招法比较能够理解。这使得我在这场特殊的比赛中，有时对局势的判断比吴九段更为准确，虽然我的围棋水平不高。下面用几个图来解释一下机器开盘的失误和技术特色。

在右边的常见套路中，AlphaGo选择了16位挡而不是Q10拆，放黑17位打入，接着继续18位打，放黑19位冲21位断，很简单地就弃掉了三子。粗粗一看黑吃下三子实空不小，但这是AlphaGo的招法创新，黑布局感觉已经落后了。因为白有A位靠下的手段，会在上面形成一道厚势，白棋把棋走在外面，对于厚味外势的价值估计得比人类棋手更准，而且它的整体行棋方式也能与之配合。人类高手出于实战考虑选择实地的更多，通常认为虚虚的外势不太好掌控。从大局观来看，AlphaGo的理解更合乎棋道。

这个局面的看点是AlphaGo第48手断入，然后被黑51全部吃下，亏了不小的目数。这是确定无疑的损失，机器犯了错。这个错误非常象AlphaGo和樊麾的第三局，它也是在黑右下大空里走了几手，没有棋却损了空。为什么它这么下？

48手这个断是很明显的直觉要点，在AlphaGo的策略网络里估计会是排名很前的选择。后续捣乱可以连续多招，黑要小心应对，下错了就立刻完蛋。黑应对了，白可以继续“考验”黑。AlphaGo也会用策略网络模拟黑的应对，正确应对的招数肯定有，但也有错误的建议给出来。这样，连续搜索展开后，在不少叶子节点AlphaGo高兴地发现黑应错了被白一举击溃。就算黑一直应对正确，最后白损失也不大，能够完封右边中，大局上还是自己好。所以，蒙特卡洛模拟（MCTS）对48这手给出的胜率评分会比较高。这应该算是AlphaGo算法框架的一个bug。AlphaGo愿意下这种“局部变化复杂，对手应对错误自己立刻胜利，应对正确自己稍亏但大局还好”的辣招。对人类高手来说，这种计算应该不难，所以就占了便宜。48手算是亏目较多的一次小bug，但是局面还早。这时AlphaGo对自己的胜率估计应该比下出48手时低一些了，它终于知道吃了亏，但当初就是愿意去这么试。因为手数较多，它下48的时候并不知道会亏。只有定型的差不多了，才觉得算清了，没有东西。

1 2 3 下一页余下全文
|

举报
- 违反法律法规
- 垃圾信息、广告
- 色情、淫秽信息
- 人身攻击
- 谣言、不实信息
- 冒充，冒用信息
- 破坏社区秩序
- 其他
- 涉未成年人有害信息
观察者网举报制度规范
确定取消
标签谷歌 AlphaGo 围棋人工智能李世石
- 责任编辑: 陈佳静
搜索

   观察者头条查看全部

美日欧不懂吃，小龙虾何以成“国民夜宵”？评论 0

买来的捷径，也是被瞄准的命门评论 82

“中国才没有兴趣迎合法国” 评论 96

俄军会打波罗的海国家？美军司令：没有的事评论 51

“再不改革，10年后美国富人只能去中国看癌症了…” 评论 126

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

陈经：感谢AlphaGo对围棋的贡献，人机缠斗刚刚开始

美日欧不懂吃，小龙虾何以成“国民夜宵”？

“中国进口骤降，需求崩了？真相是…”

4天3船被炸3人遇难，“印度竟对美降调，要是搁中国…”

警惕！“安倍挑拨中俄未果，高市也想试试”

加拿大开幕式翻车

特朗普：打死了

“中美独占，中等强国插不进脚”

“尽管美国围追堵截，‘中国’无处不在”

Anthropic：最先进模型，外国人禁用

梅德韦杰夫：统统粉碎

“杀鸡儆猴”

1岁男童因感冒输液后离世，海南乐东通报

“中国才没有兴趣迎合法国”

制裁菲防长影响对菲援助？外交部回应

新氧发布《马思纯，享年三十七岁》后道歉，马思纯方起诉

伊朗方面发布“战争杯”海报：战争常客成了世界杯东道主