-
科大讯飞力压微软获机器阅读理解SQuAD测试第一
关键字:如何夺取全球第一
在SQuAD官网的成绩榜单上,可以看到科大讯飞与哈工大联合实验室提交的模型名为“Interactive AoA Reader”,这是讯飞经过不断摸索之后提出的“基于交互式层叠注意力模型”(Interactive Attention-over-Attention Model)。正是这个与众不同的模型,让科大讯飞在全球自然语言理解研究领域脱颖而出跃居头名。
2016年,哈工大讯飞联合实验室发表了本次参赛模型的早期版本
要解决机器阅读理解的问题,传统的自然语言处理(NLP)方式是采用分拆任务的方法将其分成问题分析、篇章分析、关键句抽取等一些步骤,只是这种方法容易造成级联误差的积累,很难得到很好的效果。
为了解决这种误差,科学家们又提出了完全端到端的神经网络建模。采用神经网络的方法能够,消除了分步骤产生的级联误差;通过大量的训练数据学习到泛化的知识表示,对篇章和问题从语义层面上高度抽象化。
科大讯飞此次提交给SQuAD的模型,也采用了端到端的神经网络模型,但把精力更多放在如何能够模拟人类在做阅读理解问题时的一些方法。
讯飞提出的基于交互式层叠注意力模型,主要思想是根据给定的问题对篇章进行多次的过滤,同时根据已经被过滤的文章进一步筛选出问题中的关键提问点。这样“交互式”地逐步精确答案的范围,与其他参赛者的做法不太相同,最终收获了令人瞩目的成绩。
王士进告诉澎湃新闻,实际上在此次挑战赛之前,哈工大讯飞实验室在Google Deepmind、Facebook等阅读理解测试集上都取得过最好成绩。但应用SQuAD公开测试集上表现并不理想,于是他们在原创技术上根据要求进行了大幅改进。
“因为SQuAD测试是通过众包的方式构建了一个大规模的机器阅读理解数据集,答案并不只是单个词,因此直接应用我们在完形填空式问题上使用的AoA Reader等原创技术效果并不理想。后来我们针对此类问题对AoA Reader做了大幅的改进,主要思想是根据给定的问题对篇章进行多次的过滤,同时根据已经被过滤的文章进一步筛选出问题中的关键提问点,同时我们利用了多个不同类型的模型进行融合,最终在效果上有了明显的提升。”王士进说。
机器学会阅读理解的意义
科大讯飞认为,人工智能的发展主要分为运算智能、感知智能和认知智能。机器在运算智能上有极大的优势,在感知智能上也已经取得了很大的进展,例如语音识别、语音合成、图像识别、机器翻译等。而在认知智能方面,自然语言处理一直是实现人机交互、人工智能的重要技术基石,机器阅读理解正是这一领域的一个研究焦点。同样,让机器实现“能听会说”到“能理解会思考”,也一直是科大讯飞所肩负的使命和方向。
早在2014年,科大讯飞与哈尔滨工业大学就联合成立了联合实验室,作为“讯飞超脑”计划的核心研发团队之一,联合实验室致力于在语言认知计算领域进行长期、深入的技术创新,重点突破深层语义理解、逻辑推理决策、自主学习进化等认知智能关键技术,并围绕教育学习、人机语音交互、信息安全等领域实现科研成果的规模化应用。
据科大讯飞介绍,哈工大讯飞联合实验室不仅能让机器在阅读理解比赛中“考出高分”,还能让机器给考卷的主观题评分。以语文考试的作文为例,在阅卷之前老师们先置一套通用的打分标准,包括字迹工整度、词汇丰富性、句子通顺度、文采、篇章结构、立意等多个层次,研究人员让机器来学习这套方案后进行阅卷。这每一项标准背后都需要精密复杂的技术支持,比如手写识别、主题模型、人工神经网络等。
目前,科大讯飞的全学科阅卷技术在四六级、部分省份的高考、中考等大规模考试中进行了试点验证,验证结果表明计算机评分结果已经达到了现场阅卷老师的水平,满足大规模考试的需要。这项技术应用到正式考试中,可以辅助人工阅卷,减少人员投入,降低人工阅卷中疲劳、情绪等因素的影响,进一步提升阅卷效率和准确性。
此前,哈工大讯飞联合实验室曾先后在Google DeepMind阅读理解公开数据测试集、Facebook阅读理解公开数据测试集取得世界最好成绩,本次在SQuAD测试集再获全球最佳,包揽了机器阅读理解权威测试集的“大满贯”。
机器阅读理解技术拥有广阔的应用场景,例如在产品的精准问答、开放域的问答上都会起到有力的支撑作用,讯飞也在不断探索机器阅读理解技术的应用落地。
但对于机器阅读理解的“能理解会思考”的终极目标来说,现在还只是万里长征的开始,对自然语言的更深层次的归纳、总结、推理,一定是未来机器阅读理解不可缺少的部分。
而自2014年以来,科大讯飞就提出了“讯飞超脑”计划,其中的目标之一就是要让机器人考上重点大学。这次获得成绩也是为推进这一计划的努力之一。
- 原标题:科大讯飞力压微软获机器阅读理解SQuAD测试第一: 相当于6岁儿童
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:王佳璐
-
欧盟又担忧了,“小心美国成为下一个中国” 评论 13
又自吹,“没通知中美欧,做得对” 评论 87
警惕!美国新版“国安战略”8次提及台湾 评论 21
“轻松的一天”,随行高管们非常期待… 评论 39
东南亚多国表态,“缅甸措辞最严,坚定站队中方” 评论 164最新闻 Hot-
欧盟又担忧了,“小心美国成为下一个中国”
-
前东京都知事再批高市:赶紧撤回,特朗普不会为日本出手
-
笑死…诺奖没要到,特朗普拿了个国际足联和平奖
-
只字未提朝鲜,“因为特朗普想和他见面…”
-
日本政府计划在明年7月成立“国家情报局”
-
又自吹,“没通知中美欧,做得对”
-
警惕!美国新版“国安战略”8次提及台湾
-
交通运输部:坚决拥护党中央对费东斌的处分决定
-
协议签了,两国总统手都没握,特朗普撮合的就这?
-
“轻松的一天”,随行高管们非常期待…
-
“特朗普对高市早苗措辞非常严厉,甚至还说了……”
-
扎心了!美新版国安战略,辣评欧洲
-
东南亚多国表态,“缅甸措辞最严,坚定站队中方”
-
打造美版深圳!他给特朗普画饼,被曝“近乎科幻”
-
无视美国,莫迪宣布:印俄已同意…
-
“二次打击”还没解释清,美军袭击又致4死
-

观察员
上海市互联网违法与不良信息举报中心