-
小米大模型突然登顶一项测试,用了DeepSeek的方法
-
张广凯13764468101
3月17日,小米官方透露,其大模型团队在音频推理测试集MMAU榜单登顶,并强调“DeepSeek-R1的发布为我们在该项任务上的研究带来了启发”。
MMAU是一个侧重考察音频大模型理解和复杂推理能力的测试集,包含27种不同的任务,一万条涵盖语音、环境声和音乐的音频样本。
例如,其中一个任务是要求从一段10多秒的语音中,数出包含至少一个重读音素的单词数量;另一个任务是根据一段美剧《生活大爆炸》中的对话,解释其中一句话为什么是讽刺。
这是一个难度较高的测试集,人类专家的测试准确率为82.23%。而目前榜单上最强的大模型是谷歌Gemini 2.0 Flash,准确率55.6%。
小米大模型则达到了64.5%的准确率,较其它大模型有显著提升。其参数量更是只有7B,是一个非常轻量化的模型。
不过,小米的大模型倒也不是完全自己研发,而是基于开源的阿里通义大模型Qwen2-Audio-7B,并使用清华大学发布的 AVQA 数据集进行微调。Qwen2-Audio-7B自身在这个测试集上的得分是49.2%。
其实,相比于模型本身,小米这一成果的更大意义在于,证明了在音频模型领域,DeepSeek-R1的Group Relative Policy Optimization (GRPO) 方法,同样比监督微调(SFT)效果要好得多。
小米方面专门用通俗的语言解释了这个方法:
“打个比方来说,离线微调方法,如 SFT,有点像背题库,你只能根据已有的题目和答案训练,但遇到新题可能不会做;而强化学习方法,如 GRPO,像老师在要求你多想几个答案,然后老师告诉你哪一个答案好,让你主动思考,激发出自身的能力,而不是被“填鸭式”教学。当然,如果训练量足够,比如有学生愿意花很多年的时间来死记硬背题库,也许最终也能达到不错的效果,但效率太低,浪费太多时间。而主动思考,更容易快速地达到举一反三的效果。强化学习的实时反馈可能会帮助模型更快锁定高质量答案的分布区域,而离线方法需要遍历整个可能性空间,效率要低得多。”
此外,小米团队还发现,如果让模型像DeepSeek一样,给出显性的推理过程,最后的准确率反而下降到61.1%,也就是说,显式的思维链结果输出可能并不利于模型的训练。这是相较于DeepSeek的一个新发现。
最后,小米方面也指出,尽管当前准确率已突破 64%,但距离人类专家 82% 的水平仍有差距,音频大模型仍然远远落后于人类听觉语言推理。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 张广凯 
-
人工韧带有望打破国外垄断,投资人为何等不及国产替代?
2025-03-17 17:24 观网财经-健康 -
麒麟X90处理器曝光,华为首款PC级CPU来了?
2025-03-17 16:46 观网财经-科创 -
3GPP换届,华为、vivo、中国移动、中国电信获四个主席席位
2025-03-17 15:33 观网财经-科创 -
宁德时代正开发第二代钠电池:性能已与磷酸铁锂电池接近
2025-03-17 13:50 大公司 -
韩国巨头减产、美光停电,闪存芯片要涨价了
2025-03-17 13:14 观网财经-科创 -
宝马宣布与华为达成合作,未来将深度集成华为HiCar
2025-03-17 12:31 华为 -
1688全面松绑“仅退款”
2025-03-17 11:52 观网财经-互联网 -
2月南京新房价格环比涨幅又跑赢全国,各地房价同比降幅继续收窄
2025-03-17 11:17 观网财经-房产 -
京东外卖入驻商家已破30万家,覆盖全国126城
2025-03-17 10:59 观网财经-互联网 -
3000亿国补扩容,滴灌到县城
2025-03-17 09:57 观网财经-消费 -
华为申请MateRobot商标
2025-03-17 09:50 观网财经-科创 -
苹果计划在AirPods上配备实时对话翻译功能
2025-03-16 20:57 观网财经-科创 -
母猪产后护理难?中国AI已经开始“下乡”了
2025-03-16 12:03 观网财经-科创 -
年化利率高达20倍!借贷宝被暂停运营
2025-03-16 09:38 315维权 -
土巴兔:未与火眼云达成实质性合作
2025-03-16 09:16 315维权 -
即将连亏3年,360用户体验何时能提升?
2025-03-15 22:51 观网财经-互联网 -
市场监管总局发声
2025-03-15 22:21 -
知情人士:偷个人信息的获客公司每日处理100亿条数据
2025-03-15 22:21 315维权 -
最高年化利率近6000%!在评论区一不小心借到“高利贷”...
2025-03-15 21:39 315维权 -
啄木鸟回应:确认属实将会对师傅进行严格处罚
2025-03-15 21:20 315维权
相关推荐 -
-
中方制裁20家美军工企业,清单公布 评论 125
河南学校宿舍火灾致13死,宿管老师被判六年冤不冤? 评论 222
韩国想挖稀土“抗衡中国”,但越南想要更多 评论 96
身体很诚实!法国人圣诞狂扫中国货 评论 112
“这一年里,欧盟到底受了多少窝囊气?” 评论 74最新闻 Hot-
中方制裁20家美军工企业,清单公布
-
普京:除了顿巴斯,其他可以谈
-
英媒炒作:中国连这都主导,很严重
-
欧盟强硬表态:绝不屈服
-
沙特空袭也门,画面曝光
-
美军“圣诞夜”动手,尼日利亚证实
-
爱泼斯坦案新文件披露英王弟弟涉虐待?英国警方:正联系FBI
-
河南学校宿舍火灾致13死,宿管老师被判六年冤不冤?
-
自问自答,“能匹敌中国海军吗?难!”
-
美媒感叹:今年最重要的一课,“永远别低估中国”
-
“拜登在哪?”人走茶凉,还被“好大儿”背刺…
-
靠加密货币赚翻的特朗普,盯上欧洲最大核电站?
-
韩国想挖稀土“抗衡中国”,但越南想要更多
-
今天,多条高铁、高速公路开通运营
-
荷兰靠中国货赚了…
-
9.04万亿日元!日本2026财年防卫预算再创新高
-

观察员
上海市互联网违法与不良信息举报中心