-
阿里“最强开源模型”,昇腾、海光已适配
最后更新: 2025-04-29 14:30:26
(文/杨依婷 编辑/吕栋)
4月29日凌晨,阿里新一代通义千问模型Qwen3发布并开源,它的参数量仅为DeepSeek-R1的1/3,但成本大幅下降,性能超越R1、OpenAI-o1等全球顶尖模型,被媒体称为“全球最强开源模型”。
随后,华为计算官方发文称,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。海光信息方面也表示,海光DCU迅速完成对全部8款模型的无缝适配+调优。
根据阿里云官方信息,此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
其中的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力的结果。
此外,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹,甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。
Qwen3是国内首个“混合推理模型”,模型支持两种思考模式:思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法适合需要深入思考的复杂问题。非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
在预训练方面,Qwen3的数据集相比Qwen2.5有了显著扩展。Qwen2.5是在18万亿个token上进行预训练的,而Qwen3使用的数据量几乎是其两倍,达到了约36万亿个token,涵盖了119种语言和方言。
从官方数据来看,在考察代码能力的LiveCodeBench评测中,Qwen3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard的测评中,Qwen3分别以95.6分超越了OpenAI-o1及DeepSeek-R1;在评估奥数水平的AIME25测评中,Qwen3以81.5分刷新开源记录。
Qwen3发布后,华为计算方面发文称,此前昇腾MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。
随后海光信息也表示,在“深算智能”战略引领下,海光DCU迅速完成对全部8款模型的无缝适配+调优,覆盖235B/32B/30B/14B/8B/4B/1.7B/0.6B,实现零报错、零兼容性问题的秒级部署。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 杨依婷 
-
美的格力隔空打架,谁是“家用空调线上零售第一”?
2025-04-29 13:58 观网财经-消费 -
特朗普发动单边贸易霸凌后,比交易更“艺术”的事情出现了…
2025-04-29 13:18 -
向AI电商领域进军,ChatGPT搜索上线购物推荐功能
2025-04-29 12:21 观网财经-互联网 -
阿里发布并开源模型Qwen3,成本仅为DeepSeek-R1的1/3
2025-04-29 11:16 观网财经-科创 -
Qwen3性能超越DS-R1;曝马斯克孩子远超14个;ChatGPT推出购物功能
2025-04-29 09:02 观网财经-互联网 -
截至3月末,全国地方政府债务余额501650亿元
2025-04-29 08:46 -
茶咖日报|沪上阿姨5月8日起在港交所交易
2025-04-28 19:55 观网财经-消费 -
最强“苹”替?vivo称备货几十万的新旗舰已缺货
2025-04-28 18:08 观网财经-科创 -
华为独占近80%份额,折叠屏的战争结束了吗?
2025-04-28 18:05 观网财经-科创 -
Switch新机或将面临高额关税冲击,消费者担忧价格上涨
2025-04-28 17:33 观网财经-互联网 -
加码多模态能力,夸克发布全新“AI相机”
2025-04-28 17:24 观网财经-互联网 -
AIDC建设与国产替代加速,良信股份一季度营利双增
2025-04-28 17:07 观网财经-科创 -
Kimi与财新传媒达成内容合作 上线权威信源徽章认证
2025-04-28 16:11 观网财经-互联网 -
美债下跌会否影响中国的美元资产收益?央行回应
2025-04-28 10:59 金融观察 -
稳健领跑,滨江集团首进全国前十
2025-04-28 10:36 观网财经-房产 -
欧菲光一季度再亏5895万:手机汽车都卷,怎么办?
2025-04-28 09:49 观网财经-科创 -
宝马中国宣布接入DS;美的人形机器人5月进厂;哪吒2获华表奖特别贡献影片
2025-04-28 08:41 观网财经-科创 -
五粮液2024年营收近900亿元,毛利率超82%
2025-04-27 20:53 观网财经-消费 -
超越DeepSeek,中国开源“集团军”重塑全球AI生态
2025-04-27 20:47 观察者头条 -
“落寞网红”绿茶,为IPO爱上下沉市场
2025-04-27 18:55 观网财经-消费
相关推荐 -
“轻松的一天”,随行高管们非常期待… 评论 15
东南亚多国表态,“缅甸措辞最严,坚定站队中方” 评论 131
呵呵,“‘民主国家’看不上中国技术”? 评论 313
普京访印:美国都在买,印度凭啥不能买? 评论 90
日本开发稀土担心中国干扰?日防相放话 评论 138最新闻 Hot-
“轻松的一天”,随行高管们非常期待…
-
“特朗普对高市早苗措辞非常严厉,甚至还说了……”
-
扎心了!美新版国安战略,辣评欧洲
-
东南亚多国表态,“缅甸措辞最严,坚定站队中方”
-
打造美版深圳!他给特朗普画饼,被曝“近乎科幻”
-
无视美国,莫迪宣布:印俄已同意…
-
“二次打击”还没解释清,美军袭击又致4死
-
欧盟,“罚酒三杯”?
-
呵呵,“‘民主国家’看不上中国技术”?
-
普京访印:美国都在买,印度凭啥不能买?
-
“白宫‘慌乱应对’,想赢中国,支持得到位啊”
-
国安战略报告迟迟未出,“美财长要求软化对华措辞”
-
自民党“黑金”丑闻“吹哨人”再出手,这次是高市
-
“彻底反转了,中国是发达国家,我们才是新兴国家”
-
“华德858”轮触礁断裂
-
机密通话曝光!“美国恐将背叛,你要小心”
-

观察员
上海市互联网违法与不良信息举报中心