陈经：AlphaGo升级成Master后的算法框架分析

APP下载

扫一扫

下载观察者APP

陈经：AlphaGo升级成Master后的算法框架分析
- 陈经风云学会会员，《中国的官办经济》
分享到：

2017-01-09 15:51:05 字号：A- A A+ 来源：观察者网

关键字: 围棋AlphaGoMaster算法框架

现在职业棋手与AlphaGo团队的棋艺竞争态势可能是这样的。AlphaGo不再靠MCTS主导搜索改而以价值网络主打，思考时间大大缩短，在10秒以内就达到了极高棋力，之后时间再长棋力增长也并不多。棋力主要是由价值网络的质量决定的，堆积服务器增加搜索时间对搜索深度广度意义并不太大。所以Master已经较充分的展示了实力，并不是说还有棋力强大很多的版本。这和国际象棋AI类似，两个高水平AI短时间就能大战100局，并不需要人类那么长的思考时间。

Master的60局快棋击中了人类棋艺的弱点，它极为自信地主动发起挑战敢于导入复杂局面，而人类高手却没有能力在30秒内完善应对这些不太熟悉的新手。而这些新手并不是简单的新型，背后有Master的价值网络支持的庞大搜索树。如果价值网络的这些估值是准确的，人类高手即使完美应对，也只能是不吃亏，犯错就会被占便宜。有些局面下，价值网络的估计会有误差，这时人类高手有惩罚Master的机会，但需要充足的时间思考，也要有足够的自信与Master的判断进行较量。这次60局中棋手由于用时太短心态失衡很少做到，一般还是会吃亏。

以下是我对柯洁与AlphaGo的人机大战的建议：

1. 要对机器有足够了解，不要盲目猜测。可以简单的理解，它接近一个以价值网络为基础的传统搜索程序。

2. 要相信机器并不完美。如果它的局面评估函数没有错误了，或者远远超过人，那就和国际象棋AI一样不可战胜了。但围棋足够复杂，即使是几千万局的深度学习，也不可能训练出特别好的价值网络，一定会有漏洞与误差。只是因为人的局面评估也不是太好，才显得机器很厉害。

3. 这次机器会坚定而自信地出手，它改变了风格，在局面仍然胶着的时候不会回避复杂变化。因为它的搜索深度广度增加了，它认为自己算清了，坚定出手维护自己的判断，甚至会主动扑劫造劫。

4. 机器的退让是在胜定的情况下，它认为反正是100%获胜了，就随机选了一手。后半盘出现这种情况不用太费劲去思考了，应该保留体力迅速下完，下一局再战斗。

5. 机器的大局观仍然会很好，基于多次模拟数空，对于虚空的估计从原理上就比人强，这方面人要顶住但不能指望靠此获胜。还是应该在复杂局部中与机器进行战斗，利用机器价值网络的估值失误，以人对局面估计的自信与机器的自信进行比拼。机器是自信的，人类也必须自信。也许机器评估正确的概率更大，但是既然都不完美，人类也可能在一些局面判断更为正确。

6. 机器对稍复杂战斗局面的评估是有庞大搜索树支持的，并不会发生简单的漏算，不应该指望找到简单的手段给机器毁灭性打击。由于人类的思考速度慢，时间有限，不能进行太全面的思考。应该集中思考自己判断不错的局面，围绕它进行论证。如果这个判断正好是人类正确、机器错误，那人是有机会占优的。

通过以上分析，我对人机大战柯洁胜出一局甚至更多局还是抱有一定期望的。希望柯洁能够总结分析围棋AI的技术特点，增加自信，针锋相对采取正确的战略，捍卫人类的围棋价值观。
本文系观察者网独家稿件，文章内容纯属作者个人观点，不代表平台观点，未经授权，不得转载，否则将追究法律责任。关注观察者网微信guanchacn，每日阅读趣味文章。

首页上一页 1 2 3 4 5 6 余下全文
标签围棋人工智能 AlphaGo 算法搜索评估科技
- 请支持独立网站，转发请注明本文链接：
- 责任编辑:武守哲
搜索

   观察者头条查看全部

“TikTok只是烟雾弹，美情报机构才无时无刻不在…” 评论 89

获得军援后以色列不会违反国际法？美国多部门：不可信评论 79

最后通牒？以色列放话“要么签，要么打” 评论 131

“这把火怎么点着的？” 评论 423

布林肯来华谈的怎么样？是否不虚此行？评论 272

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

陈经：AlphaGo升级成Master后的算法框架分析

“这把火怎么点着的？”

“美国施压日韩荷再收紧对华限制，这次把手伸向工程师”

布林肯来华谈的怎么样？是否不虚此行？

不满加沙政策，美国务院第三人辞职

这把火烧到欧洲了

变调了，“美政府决定不制裁”

印度学者拱火：美国忙不过来，日本别管远方的乌克兰，先关注台湾

侵占数百万美元国有土地，乌克兰农业部长被捕

印度外长又狂怼尼赫鲁

“美国去死”宣传册，疯传美国高校

除了TikTok，美国还想封禁大疆

“中国主导地位摆在那，美国这么搞要完”

“看看，这就是美国的警察”

“中国市场就是健身房，不上强度跟不上”

“消息传到布林肯那了吗？”

桑德斯炮轰内塔尼亚胡：你这么干是侮辱我们美国人智商