-
梅林:计算机视觉大赛 中国团队全面获胜亮点在哪里?
关键字: 计算机视觉大赛ImageNet ILSVRC2016图像识别ImageNet观察者网:场景分类和场景分析各考验哪方面的技术,又各有什么作用?
梅林:场景分类任务主要是针对整张图分析其所属场景类别,有点类似于图像分类,但是比图像分类难度高,因为该任务的数据中往往不是要分类出物体类别,而是物体之间结合一起组成的场景类别,而且场景分类一般图像中目标很多很杂,不像图像分类的图像目标类别很单一。而场景分析则是将场景中的背景和前景均分割出来,比如 sky, road, person, bed,这些类别,既包括了目标又包括了组成场景的背景。场景分类和场景分析是从不同侧面考察算法对场景的理解能力,可以作为其他计算机视觉任务的基础步骤,另外在数据的标注收集等方面也具有很好的用处。
场景分析

场景分类
观察者网:为什么这次世界级的比赛好像缺了好多重量级的选手,没有看到知名IT大厂参与比赛?
梅林:今年也有“IT大厂”参加,比如Facebook的ResNext团队,而且其团队几乎全是重量级选手:有之前就职于微软亚洲研究院的ResNet作者何恺明;而Ross Girshick,则在目标检测领域有多项开创新工作,目前基于深度学习的目标检测算法,均或多或少基于其工作进行展开;Piotr Dollar也在计算机视觉领域有很多极具影响力的工作(比如EdgeBoxes和COCO等)。ResNext队在目标分类上用较简单模型取得了很好的成绩,错误率3.031%,仅次于Trimps-Soushen队的2.991%,可以说他们的模型依然是非常有潜力!
观察者网:有人说这届比赛上,往年有alexnet,vgg,googlenet,resnet这样的神作,而今年在算法上基本没有创新,有创新做不下去了就来拼资源的即视感,您对这个观点怎么看?
梅林:对于知乎上的这个问题,其实香港中文大学的欧阳万里老师给了很好的回答,我这里不妨引用他的观点:“今年有没有神作不知道,但是佳作应该还是有的。个人还是非常期待在workshop上能向各位参赛者学习到一些新的东西。”
我也想补充一下,每一个领域的发展总是曲线上升的,曲线总是往上走的,虽然发展的梯度有快有慢,但是总体是朝前发展的,这就是发展的规律。
观察者网:网络上有观点认为,scene classification任务有队伍使用外部数据作弊,应该取消比赛成绩。又有人含沙射影的表示中国团队取得优异成绩是因为作弊,这种说法有依据么?
梅林:我注意到竞赛主办方对数据使用做了补充说明,应当根据其说明进行判断。至于“中国团队取得优异成绩是因为作弊”的说法,我不认为其有任何可信的依据。
观察者网:近期,国内团队先后在全球最权威的人脸检测评测平台和全球自动驾驶算法公开排行榜上取得非常好的成绩,加上在本次ImageNet ILSVRC2016上中国团队取得优异成绩,是否表明国内计算机视觉相关算法已达到国际顶尖水平,甚至是否可以认为中国在该领域已经超越美国?
梅林:我们国家的技术近年来的发展确实是突飞猛进的,而且当前国内各个行业的大数据应用如火如荼,如国内开展大规模视频监控应用的研究天然就具有很好的环境,相信通过国内计算机视觉领域同行的不懈努力,我们与国际领先机构的差距会越来越小,甚至会有行业领头出现,这些都是指日可待的。
观察者网:如何评价今年的竞赛?
梅林:今年竞赛有这样几个特点:
1. 参赛队伍多、竞争异常激烈。今年共有85支团队参赛,创历史新高,包括工业界和高校研究所等,说明该竞赛的影响力之大、关注范围之广。众多参赛队伍无不精心备战,竞争异常激烈。比如目标分类的单项成绩,第一名与第二名仅0.0004的错误率之差。能够取得好的成绩,是人才、算法、硬件、系统等多位一体的综合实力的体现。
2. 单项任务多、竞赛规模升级。本次竞赛共分为五项大任务,其中每项任务又细分为若干个子任务。这说明竞赛的评价规则变得越来越严格和细致。无论在那一个单项上取得突破成绩,都有助于推动计算机视觉领域的发展。
3. 华人参与广、推动行业发展。国内外许多华人团队参与今年的竞赛,说明华人在计算机视觉领域的活跃度和竞争实力都在不断提升,而竞赛也对国内计算机视觉的发展具有显著的推动作用。国内近年对计算机视觉、人工智能的应用需求巨大,而且在很多领域如视频监控、网络/电商/医疗媒体数据检索等正在形成全球最大规模的应用,正在形成计算机视觉研究天然的实验场。相信随着“一带一路”的深入,中国在计算机视觉技术方面的积累一定会为世界人类福祉做出贡献!
4. 突破成果少、仍有创新佳作。今年的竞赛虽然没有出现ResNet, Inception等具有革新性的成果。但也不乏创新性工作。例如Facebook团队针对目标分类任务在去年ResNet模型的基础上进行了模块化的简化,香港中文大学和商汤科技团队针对较为困难的目标检测任务引入了更深的网络模型以及门控双向CNN结构,此外还有很多团队采用了多个功能模块级联的深度网络架构,在不同任务中均取得了准确性的有效提升。相信在接下来的ECCV专题论坛上,会有不少精彩工作呈现。
梅林,公安部第三研究所物联网技术研发中心主任,1972年生,2000年获得西安交通大学工学博士学位。2000年至2006年,先后在复旦大学计算机科学与工程系、德国弗赖堡大学计算机系、德国人工智能研究中心进行博士后和高级访问学者研究工作。2007年,加入公安部第三研究所担任警用装备技术研发中心智能图像处理学科带头人,2008年任物联网技术研发中心副主任,2012年2月任物联网技术研发中心主任。2012年12月受聘公安部第三研究所研究员, 2015年被上海市科委评为上海市优秀技术带头人。主要研究领域包括计算机视觉、人工智能、物联网应用、大数据处理等方面。负责规划了新一代视频监控网络体系、视频警务应用产品体系以及相关标准体系,为“十三五”期间公安视频监控的大规模深度应用奠定了基础。近年来先后主持了国家多部委及上海市科研项目十余项,先后在国内外期刊会议发表学术论文60余篇,申请国家发明专利近50项,获得软件著作权登记9项。
现任上海市图像图形学学会理事、中国计算机学会计算机视觉专业委员会委员、中国指挥控制学会富媒体专业委员会委员,上海智能视频监控工程技术研究中心(筹)常务副主任。
(采访:铁流)
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:孙武
-
断供、断线、断念!多军种开展联合立体火力打击 评论 49
中国有望登顶,终结日企20余年霸主地位 评论 168
特朗普表态:不担心 评论 251
强拆巴拿马华人纪念碑,原来她蓄谋已久? 评论 179
拖太久!“内塔尼亚胡不断搞破坏”,美国没耐心了 评论 28最新闻 Hot

观察员
















上海市互联网违法与不良信息举报中心