-
阿尔法狗又进化了 自我学习完成国际象棋和将棋
关键字: AlphaGo Zero【观察者网TMT报道】创造以简单规则为基础不断自我学习的程序一直是人工智能领域的重要目标。最近,AlphaGo Zero算法在围棋上实现了超过人类水平的成绩。
近日,DeepMind在arXiv发表论文,表示AlphaGo Zero已经具备很强的通用性,可以学着完成其它任务。新的算法经过不到 24 小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练3天时间的AlphaGo Zero。
计算机国际象棋和计算机科学本身一样古老。查尔斯·巴贝奇、艾伦·图灵、克劳德·香农和冯诺依曼都曾设计硬件、算法以及理论来让计算机分析和玩国际象棋。国际象棋随后成为了一代人工智能研究者努力希望克服的挑战,最终,我们也实现了超越人类水平的国际象棋程序。然而,这些程序高度局限于它们所处的领域,在没有人类大幅度修改的情况下,无法被泛化去处理其他任务。
在论文中,DeepMind 实现了类似但完全泛化的算法(fully generic algorithm)——在未输入游戏规则以外任何知识的情况下,其推出的全新算法 AlphaZero 在国际象棋和日本将棋上实现了和围棋同样的高水平。DeepMind 宣称该研究证明了 AlphaZero 作为一个通用性强化学习算法可以从零开始,在多种具有挑战性的任务上实现超越人类的水平。
标签 谷歌- 请支持独立网站,转发请注明本文链接:
- 责任编辑:赵晓明
-
“宁愿关闭在美业务也不卖” 评论 184王毅见布林肯,对美方提出三个“不要” 评论 234胜利会师! 评论 230神舟十八号载人飞船发射取得圆满成功 评论 146“准备好为同志们挺身而出了吗?”“YES!” 评论 603最新闻 Hot