-
陈经:人类智能堡垒围棋突然被谷歌智能攻破了,靠的是策略判断和暴力搜索两手都硬
关键字: 谷歌人工智能职业二段围棋围棋AI人工智能AlphaGoAlphaGo电脑围棋樊麾从人工智能技术发展上看,DeepMind使用了“深度学习”技术,而非象俞斌估计的和职业高手合作。电脑通过海量学习人类高手的棋谱,用深度神经网络快速模拟出人的招法,下出来的棋就很象人了。樊麾二段说:“如果没人告诉我,我会想对手下得有一点怪,但肯定是个很强的棋手,一个真正的人”。
樊麾二段
Facebook的围棋人工智能程序Darkforest就是用这种办法,不靠搜索,只用深度学习这一招就很快达到了之前研究者多年无法实现的棋力,扎克伯格1月27号正好发文介绍了这个进展。由于棋力还略低于Zen、Crazystone,所以不算是巨大的突破。
而DeepMind小组在搜索技术上取得了更大突破。跟Darkforest相似,AlphaGo用一个深度神经网络(policy network,“策略网络”)减少搜索的选点,象人类高手一样,只考虑少数几个可能的选点。此外,他们还建立了另一个深度神经网络(value network,“值网络”),象人类高手一样,思考到某个局面就有了结论,不必象之前的蒙特卡洛模拟那样下到终局,极大地减小了搜索的深度。
DeepMind引入的另一个逆天的高招是,让围棋人工智能自己和自己下,总结经验,自我不断提高!这个技术2015年2月就在Nature上发表了,标题是《玩游戏的软件从神经科学中吸取经验》(Game-playing software holds lessons for neuroscience)。
这个人工智能自学习的要点是,不需要告诉电脑人类的经验,就让它自己玩这些电脑游戏,只是给出玩的分数。电脑看着分数不断纠正自己的策略,最后就发展出比人类还强的电游技术。这次的AlphaGo也用了这个技术,这又是比其它电脑围棋程序强的地方。从Nature的文章看,DeepMind的绝招是,用50台电脑让AlphaGo不断和自己对弈,下了3000万盘棋!然后每盘棋选取一个局面(不多选,以避免同一盘棋中不同局面之间的相关性),根据这盘棋的最终结果判断局势优劣。这样获得了3000万个训练数据,用于训练生成“值网络”。暴力生成这么多数据需要海量的计算资源和投入,确实只有谷歌这样的大公司敢想敢做。可以看出他们的战略是智能和蛮力两手抓,两手都要硬,哪个合适就用哪个,并且互相帮助。
通过这样三招,DeepMind小组确实在围棋人工智能上取得了巨大突破。而且研究方法的潜力很大,从这个方向上走,最终象“更深的蓝”一样战胜人类最高手是完全可以想象的。一个月前,DeepMind小组就报告说围棋人工智能取得了巨大突破,会战胜人类,但当时棋迷与职业棋手并未留意。现在有了棋谱,又有了技术细节,就显得可信多了。
职业棋手李喆在微博上说:
“Google的围棋AI已具有职业水准。从棋谱初步判断是顶尖棋手让先-让先倒贴的水平,离战胜人类还有一小段距离。但这是三个月前的棋谱...以Google机器学习堆数据的速度,今年三月对决李世石相当值得期待。”
如果象报道的那样,2016年三月AlphaGo真的挑战韩国棋手李世石(过去十年获得世界冠军最多的棋手),这说明Google对AlphaGo非常有信心,认为三个月的时间就能进步到战胜顶尖高手了。DeepMind小组认为,电脑围棋的优势在于一天可以下100万盘棋,而且一直保持水平稳定,而人类能下的棋和能打的棋谱很有限,时间长了还会疲劳出错。
围棋世界冠军李世石九段
我认为这次电脑是真的有可能在围棋上战胜人类。樊麾在非正式对局中两次中盘胜AlphaGo,可见AlphaGo也是会认输的,不是永远缠斗到终局,而且樊麾是有击败AlphaGo的棋力的,在正式比赛中可能是太紧张技术变形了。如果李世石象樊麾二段一样心态失衡露出大破绽,肯定会被电脑抓住输掉。即使小心应付,电脑也会有胜机。即使只赢李世石一盘,也是了不起的成就。最终,电脑以稳定的概率战胜职业棋手将在一二年内实现。
这无疑是人工智能领域的巨大突破,预示着机器将在棋类这项“智力运动”上彻底战胜人类。围棋这个人类自以为还能坚固防守五十年以上的堡垒,在引发了人工智能研究领域的巨大兴趣后,被机器出人意料地迅速突破了。
当然正如深度学习技术的发明人、DeepMind小组的Hassabis所言,人工智能真正的挑战是“泛化”的能力。人工智能在围棋上达到的超高能力,并不能转移到其它任务上去。
Demis Hassabis,深度学习技术发明人,Google DeepMind 的CEO,AlphaGo的20位作者之一
但是从目前达到的成就来看,人工智能带来的社会革命也许真的快来了。对于人工智能“奇点革命”有兴趣的可以参考:
对于我个人,会象许多业余棋迷一样,非常希望Google能把AlphaGo商业化推向市场。这会是围棋学习的一个革命:随时随地有最高等级的选手教你下棋。所以,暂时欢呼吧!
致谢:感谢风云学会会长袁岚峰博士(@中科大胡不归 )的宝贵意见。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:李楚悦
-
“严看死守,光干部餐食费就十多万,最后还是烧了” 评论 175“我们美国说要做的事,中国人已经做到了” 评论 112荷兰“拼了”:阿斯麦,别走! 评论 132“嫌犯从乌克兰获大量资金和加密货币,有确凿数据” 评论 355美方对俄隐瞒了部分信息?克宫回应 评论 112最新闻 Hot
-
荷兰“拼了”:阿斯麦,别走!
-
“到处都是中国威胁的夸张想象,美国很久没这样诋毁他国了”
-
美国没援乌,他倒急了:会被中国大陆看到你们的软弱!
-
《经济学人》:欧洲经济遭“三杀”,俄乌冲突、中国、特朗普
-
内塔尼亚胡重大政治危机:犹太教徒或被迫上前线
-
“我们美国人说要做的事,中国人已经做到了”
-
“嫌犯从乌克兰获大量资金和加密货币,有确凿数据”
-
“美正拟中国先进芯片企业黑名单”,驻美大使馆回应
-
“要三思啊,这种民族主义口号将毁掉国家”
-
“如果TikTok被禁,美科技巨头也应该被调查”
-
美方对俄隐瞒了部分信息?克宫回应
-
美主持人问了大家想问不敢问的问题,白宫“震怒”
-
法国叫停安理会会议,扎哈罗娃怒斥:做贼心虚
-
中国在全球率先商用5.5G,首批百城名单公布
-
这条中马“一带一路”重点铁路项目 “或延伸至泰国”
-
印度强烈抗议美国:民主国家不能这样
-