-
AI的看图说话准确率比人类还高!阿里AI再摘一冠
关键字: 阿里巴巴AI视觉对话看图说话近日, 在第二届视觉对话竞赛Visual Dialogue Challenge中,阿里AI击败了微软、首尔大学等十支参赛队伍,获得冠军。
阿里AI在视觉对话竞赛中得冠
视觉对话竞赛由美国佐治亚理工大学、Facebook人工智能实验室(FAIR)等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前视觉对话领域最权威的竞赛之一。
该竞赛要求参赛的AI在看完近万张图片后,回答出人类对于任一图片任一内容的提问。竞赛结果显示,阿里AI以74.57%的准确率获得冠军,将上一届比赛的纪录提高了16.82%。在相同的数据集中,人类的准确率仅为64.27%。
传统的视觉AI主要针对目标的检测和识别,例如识别出图片是否是一只猫,但对复杂场景中目标之间的逻辑关系理解、推理能力较弱,无法回答“这只猫旁边的男生穿了什么颜色的衣服”等复杂问题,也难以将图片信息转化为人类理解的语言输出。
阿里AI的突破在于提出了“递归探索对话模型”,综合集成了图像识别、关系推理与自然语言理解三大能力,它通过高效利用标注信息学习出模仿人类认知复杂场景的思维方式,能够有效识别图片里的实体以及它们之间的关系,推理出图片所描述的事件内容,并通过对上下文进行有效建模,理解人类提出的问题及真实意图,给出自然准确的回复。
视觉对话中,AI可以从容应对人类提问,左为AI,右为人类
视觉对话是近年来快速崛起的AI研究方向,目的在于教会机器用自然语言与人类讨论视觉内容。如果说视觉识别技术,让机器具备了视觉能力;那么视觉对话技术,则使得机器拥有了对真实视觉世界的理解与推断能力,意味着AI的认知能力将迈上新的台阶。
视觉对话技术有望人类提高地震救援效率
据了解,这项技术未来将被应用在人机交互诸多场景: 地震后在废墟中寻找幸存者的救援机器人,能够更加及时、高效地综合指挥指令和场景信息作出行动;视障人士可以通过提问阿里AI,理解网络照片中的内容,了解自身所处的周围环境;无人驾驶车辆对影响因子的意图理解会更为准确,乘客的乘坐体验更好。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:程北墨
- 最后更新: 2019-06-27 14:58:57
-
十周年放大招,B站宣布《三体》动画项目启动
2019-06-27 00:37 文化 -
普华永道:一带一路进入新阶段 中国将更多与发达国家合作
2019-06-27 00:07 一带一路 -
华为胡厚崑:不受“美国事件”影响,年底发货50万5G基站
2019-06-26 20:06 -
马云公益基金会5年深耕乡村教育,未来要输送600万乡村人才
2019-06-26 18:11 -
微信将推“发送语音过程”转文字功能
2019-06-26 13:36 -
百度李彦宏的美国战友们
2019-06-26 11:40 -
印度独角兽OYO中国困局:裁员,造假,本土团队沦为“傀儡”
2019-06-26 11:36 -
阿里CEO张勇:平台型公司并不是平台所有者,只是在运营平台
2019-06-26 10:52 互联网大佬 -
韩国电子产业亮红灯 生产出口呈现负增长
2019-06-26 09:35 -
马云罗汉堂对话诺奖得主:我是数字经济的乐观主义者
2019-06-26 09:04 文化 -
华为徐文伟:我们产生的专利数是中国的10%
2019-06-26 08:36 华为 -
滴滴发布《安全透明度报告》 一季度每百万单刑事案件发生率0.005
2019-06-25 19:01 大公司 -
优酷、华为视频达成深度合作:帐号打通、海量内容将全端共享
2019-06-25 18:47 -
汽车智行时代即将到来 MWC19上海探索未来出行新可能
2019-06-25 18:23 -
华为Mate 20 X 获中国首张5G终端电信设备进网许可证
2019-06-25 17:03 -
移动董事长杨杰:2020年在所有地级以上城市提供5G商用服务
2019-06-25 16:38 5G -
“618”进化,从“二选一”到“三国演义”
2019-06-25 15:02 消费 -
波司登回应沽空质疑 股价闪崩24%后回升10%
2019-06-25 15:00 股市 -
天猫公布三大核心策略 旗舰店2.0将在双11前全部开放
2019-06-25 13:14 大公司 -
软银宣布现有基站将继续使用华为产品
2019-06-25 11:16 华为
相关推荐 -
布林肯来华谈的怎么样?是否不虚此行? 评论 25“看看,这就是美国的警察” 评论 346习近平会见布林肯:中美应彼此成就,而不是互相伤害 评论 62“宁愿关闭在美业务也不卖” 评论 392王毅见布林肯,对美方提出三个“不要” 评论 262最新闻 Hot