-
余亮:与谷歌翻译小别胜新婚之后,看清中国人工智能到底和谷歌比什么
关键字: 谷歌翻译人工智能翻译软件语音识别百度翻译技术论剑
产品体验容易学,技术积累更是苦功夫。我相信技术人自己是绝不会只为段子翻译传神而沾沾自喜的。在自然语言处理方面,各家巨头都在比拼。
谷歌自不用说,2016年,谷歌人在《Nature》、《PNAS》、《JAMA》三大顶级科学期刊惊人地发表了218篇论文,绝大多数都关于人工智能领域。简直就是要争创“双一流”。
去年微软亚洲研究院的秦涛和他的团队,在机器翻译领域提出“对偶学习法”,听起来很有创意。目的是:利用没有标注的数据。要知道,一般机器学习需要人类标注过的数据。比如一张猫的图片需要人工打上“cat”文字标签,然后拿去训练机器。但是人工标注成本高,探求如何让机器自主学习就成了未来发展方向。
秦涛团队认为:很多人工智能的应用涉及两个互为对偶的任务,例如从中文到英文翻译和从英文到中文的翻译互为对偶、语音识别和语音合成互为对偶、基于图像生成文本和基于文本生成图像互为对偶、搜索引擎中给检索词查找相关的网页和给网页生成关键词互为对偶等等。这些互为对偶的任务可以形成一个闭环,使从没有标注的数据中进行学习成为可能。通过设定一个精巧的原始任务模型,对偶任务可以自反馈自学习。(有兴趣读者可以参考微软亚洲研究院主页上的这篇文章)
在自然语言的自主学习领域,最近百度也搞了个大新闻。余昊男、张海超、徐伟发表了一篇论文,提出了一个新的框架,把视觉识别和自然语言处理技术结合起来,让AI机器人在没有先验知识的情况下,自己学会理解人的命令并在迷宫中导航并定位物体。
他们把初始机器人称做婴儿智能体,用无数回合来迭代训练。在每个回合,只给出极少的像素和语言指令,通过梯度下降,端到端地从零开始训练,让AI在实验中自主学习环境的视觉表示,语言的句法和语义,以及如何在环境中给自己导航。比如要求智能体能够推广解释从未见过的命令和词汇。
我认为这是一项了不起的探索。为什么?前面我说人类进入了过度符号化世界,其实略有遗憾。过度符号化意味着脱离现实和实践。而这篇论文A Deep Compositional Framework for Human-like Language Acquisition in Virtual Environment旨在把AI从符号世界放入物理世界,认为只有物理世界的反馈才能让AI真正智能。研究团队认为:
有必要重温吴恩达的话:人工智能领域,很多创新都是中国人搞出来的。
那么中国企业还缺什么?古人云,做人要“世事洞明,人情练达”,改一下就可以送给中国AI企业:“技术洞明,产品练达”。技术好,还要转化为产品的体贴和话语的高度。当然,中国人总是与最好的比,要求很高,动力很足。
我听到百度基层的工程师朋友夸谷歌翻译好,我觉得,这是正确的态度。“翻译”乃国之重器,文明重器。想想严复当年对进化论的曲解翻译是如何影响中国救亡运动的?技术人或许也需要这样的高度。
附诗词对比答案:左边为百度写诗机器人的作品,右边为宋代诗人葛绍体所作
(文章原载于虎嗅网,经作者修改并授权观察者网刊发)
- 原标题:与谷歌翻译小别胜新婚之后,看清中国人工智能到底和谷歌比什么 本文仅代表作者个人观点。
- 责任编辑:马密坤
-
穆杰塔巴身处莫斯科?俄方回应 评论 38
这个小岛为何重要?让特朗普不惜考虑派地面部队 评论 86
“就连日本都婉拒”,高市能躲过一劫吗? 评论 99
“更可靠”,民调:美四大盟友转向中国 评论 166
特朗普高调喊话各国护航,盟友反应冷淡 评论 156最新闻 Hot-
穆杰塔巴身处莫斯科?俄方回应
-
这个小岛为何重要?让特朗普不惜考虑派地面部队
-
伊朗黑客让美国人见识到了,“可能是最严重的战时网络攻击”
-
德国回怼特朗普:这不是北约的战争
-
“一手烂牌的伊朗,正让美以失去主动权”
-
“就连日本都婉拒”,高市能躲过一劫吗?
-
离美赴港大,越南裔数学家发声:最优秀学生多来自中国
-
“首次,无船通航的一天”
-
“中国瞄准美日又一供应垄断”
-
美媒感慨:中国这张网,抵御住了能源冲击
-
伊朗外长:人们被杀害,就因为特朗普想“找乐子”
-
内塔尼亚胡发视频辟谣死亡传言,网友又吵起来了
-
伊朗“开绿灯”?印度外长:努力有了成果
-
盟友不给面,特朗普气坏:北约“要糟了”
-
特朗普高调喊话各国护航,盟友反应冷淡
-
“爱国之举”,5名伊朗女足成员放弃澳方庇护回国
-

观察员
上海市互联网违法与不良信息举报中心