-
阿里千问旗舰推理模型正式发布
最后更新: 2026-01-27 10:29:47据“阿里云”公众号1月26日消息:刚刚,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。
千问新模型通过总参数、强化学习、推理计算的极致规模扩展,实现了性能的大幅飞跃,在多项关键性能基准测试中刷新全球新纪录。同时,该模型采用全新测试时扩展机制,推理性能提升同时更经济,并大幅增强原生Agent能力,模型对话时可自主调用工具。
目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。此外,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。
体验地址👇Qwen Chat:https://chat.qwen.ai/
百炼API:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23
千问APP网页版:https://www.qianwen.com/
规模最大、能力最强的千问推理模型
Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。
此前,预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分,推理性能已让人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。
其中,在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美国际顶尖AI大模型。
测试时扩展机制,推理性能提升且更经济
在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。
业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论很常见,冗余推理效率低下;而千问采用的这一机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,因此获得更智能的推理结果。
基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。
大幅增强原生Agent能力,对话时自主调用工具
面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。
这种自适应的工具调用能力可在QwenChat上完整体验,Qwen3-Max-Thinking模型会自主选用「搜索」、「个性化记忆」和「代码解释器」等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。
该能力源自于通义团队专门设计的训练流程。具体而言,在完成初步的工具使用微调后,团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。
- 责任编辑: 万肇生 
-
董明珠卸任格力电子元器件法定代表人、执行董事
2026-01-26 21:27 -
天数智芯发布国产GPU架构路线图,预期2027年超越英伟达Rubin
2026-01-26 20:03 产经 价值快讯 -
妙可蓝多创始人遭“免职”,蒙牛全面接管奶酪帝国
2026-01-26 19:59 -
从《琅琊榜》到《流浪地球》,邵氏兄弟吞下华人文化核心资产
2026-01-26 17:40 观网财经-消费 -
获得算力企业3.45亿注资重整,“家装第一股”控制权换人了
2026-01-26 17:38 产经 A股/港股/美股 -
“美航母逼近”,伊朗挂起巨幅画…
2026-01-26 15:22 伊朗局势 -
印奇出任阶跃星辰董事长,中国版“xAI+特斯拉”来了?
2026-01-26 11:17 观网财经-互联网 -
腾讯豪掷10亿重启红包大战,大厂涌入春节AI战场
2026-01-26 10:45 观网财经-互联网 -
李亚鹏:嫣然医院寻“带公园的”新家,现场捐赠通道暂时关闭
2026-01-26 10:33 观网财经-健康 -
IDC报告:人形机器人已在六大场景规模商用,中国厂商引领行业
2026-01-26 10:33 产经 科创 -
链接全球、赋能全链,建发股份筑牢产业链供应链“压舱石”
2026-01-26 10:24 观网财经-房产 -
中国商业航天不是跟跑,而是定义玩法的国家之一
2026-01-26 08:09 观网财经-科创 -
iPhone Air直降2000元参加国补
2026-01-25 08:16 产经 科创 -
AI走进美术馆,能否实现艺术普惠?
2026-01-24 10:20 观网财经-互联网 -
600亩葡萄藤判“死刑”:国产葡萄酒大厂断臂求生
2026-01-23 18:03 -
京东请喝腊八粥,七鲜小厨五城新店齐开
2026-01-23 17:57 观网财经-消费 -
加拿大总理因何盯上中国能源“三巨头”
2026-01-23 17:57 观网财经-科创 -
买房反被开发商索赔1200万,滨江凯旋门陷交易风波
2026-01-23 17:44 观网财经-房产 -
印度或罚苹果380亿美元
2026-01-23 17:30 产经 科创 -
罚没2800余万、实控人终身禁入!证监会严肃查处瑞丰达违法违规案件
2026-01-23 17:29
相关推荐 -
不学卡尼?访华前夕,斯塔默再谈中美 评论 55
还要抓多少人才罢休?“全部” 评论 103
英国首相近8年未访华,“斯塔默认为这是失职” 评论 133
美方气急败坏:几个月前还跟我们一起搞中国… 评论 120
“中国正遵循拿破仑名言:别在对手犯错时打断他” 评论 208最新闻 Hot-
不学卡尼?访华前夕,斯塔默再谈中美
-
又放厥词,“若美军在台海被攻击,日本不能…”
-
“特朗普就是想在这上面拿捏加拿大”
-
加拿大警钟敲响!“美国别搅局”
-
还要抓多少人才罢休?“全部”
-
欧盟正式批准:明年全面禁止进口俄气
-
又舔上了!“欧洲永远离不开美国”
-
国际刑事法院:杜特尔特下月将出席听证会
-
委内瑞拉代总统:我们受够了美国指手画脚
-
欧盟动手了!“启动对X平台的正式调查”
-
英国首相近8年未访华,“斯塔默认为这是失职”
-
110%→40%,印欧被曝将有大动作
-
C919生产开门红,“今年有望每15天内造一架”
-
“美航母逼近”,伊朗挂起巨幅画…
-
美方气急败坏:几个月前还跟我们一起搞中国…
-
利益输送?特朗普政府砸下最大一笔稀土投资
-

观察员
上海市互联网违法与不良信息举报中心