最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余

APP下载

扫一扫

下载观察者APP

最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余

分享到：

2017-10-19 15:27:06 字号：A- A A+ 来源：观察者网综合

关键字: 阿法狗新版发布新版阿法狗远胜旧版柯洁：人类太多余

北京时间今天（10月19日）凌晨，谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ，代号AlphaGo Zero。AlphaGo曾打败了中国顶尖棋手柯洁，而AlphaGo Zero经过3天的训练，就以100：0的比分完胜AlphaGo。这条消息点燃了中国围棋界，连柯洁也发微博感叹：对于AlphaGo的自我进步来讲，人类太多余了……

谷歌今天发布的这款名为AlphaGo Zero有多厉害？据“快科技”网站文章的介绍，它的系统可以通过自我对弈进行学习，它利用了一种名为强化学习的技术。在不断训练的过程中，这套系统开始靠自己的能力学会围棋中的一些高级概念。

经过3天的训练后，这套系统已经可以击败AlphaGo Lee，也就是去年击败韩国顶尖棋手李世石的那套系统，而且比分高达100比0。经过40天训练后，它总计运行了大约2900万次自我对弈，使得AlphaGo Zero得以击败AlphaGo Master（今年早些时候击败世界冠军柯洁的系统），比分为89比11。

AlphaGo之父戴密斯·哈萨比斯（Demis Hassabis）

与学习大量人类棋谱起步的前代AlphaGo不同，AlphaGo Zero是从“婴儿般的白纸”开始，通过3天数百万盘自我对弈，走完了人类千年的围棋历史，并探索出了不少横空出世的招法。

值得注意的是，虽然AlphaGo Zero在几周的训练期间学会了一些关键概念，但该系统学习的方法与人类有所不同。另外，AlphaGo Zero也比前几代系统更加节能，AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。

DeepMind团队创始人David Silver介绍AlphaGo Zero说，这款程序超越了过去所有的AlphaGo版本，目前是世界上最大强大的围棋程序。

（视频截图，下同）

它的学习不使用人类数据，而是自我学习，完全从零开始。之所以它能比向人类数据学习的程序效果更好，是因为它每次对弈的“陪练”都被校准为与它持平的水平，它的“陪练”从非常基础的水平开始，逐渐上升为非常高的水平。

David Silver还说，人们一般认为机器学习就是大数据和海量计算，但是他们在AlphaGo Zero的研究中发现，算法比所谓计算或数据可用性更重要。

以下是完整视频：

DeepMind联合创始人和总裁David Silver介绍新版阿法狗。（视频自腾讯）

1 2 下一页余下全文
标签人工智能谷歌围棋
- 原标题：柯洁：对于AlphaGo的自我进步来讲人类太多余
- 请支持独立网站，转发请注明本文链接：
- 责任编辑:魏其濛
搜索

   观察者头条查看全部

俩人要对伊朗使坏，涉及中国评论 42

“Ni hao，我们现在都是中国人了” 评论 78

鲁比奥：不与中国对话，是失职评论 102

欧洲“长舒了一口气”，其实鲁比奥是换汤不换药评论 37

“一次又一次，欧洲领导人视而不见，但这次不一样” 评论 41

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余

俩人要对伊朗使坏，涉及中国

“对于中国游戏未来的20年，我充满信心”

英法德等称俄用“箭毒蛙毒素”毒死纳瓦利内，俄方：无稽之谈

“福特找白宫：拉中企来美国合资造车吧”

“Ni hao，我们现在都是中国人了”

欧洲“长舒了一口气”，其实鲁比奥是换汤不换药

又戴高帽，“中国一个电话就能搞定”

有人不爽了：绥靖！特朗普上赶着为中国效力

秘鲁拒绝美国忽悠：主权绝未受中资威胁

鲁比奥：不与中国对话，是失职

“美国总是要求乌克兰作出让步，而不是俄罗斯”

“一次又一次，欧洲领导人视而不见，但这次不一样”

卡拉斯接过了这顶帽子，表情微妙

爱泼斯坦烂账上还有这位西方“人权先生”

诺贝尔和平奖，暴露了本来面目

自家产品被用于绑架马杜罗，这家美国AI公司很不满

最强“新狗”AlphaGo Zero发布 柯洁：对于它的自我进步来讲，人类太多余

最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余