-
科技巨头同日押注Agent化,阿里云交出“芯-云-模型-推理”全栈答卷
(文/陈济深 编辑/张广凯)
5月20日,阿里云在2026阿里云峰会上宣布完成"芯片-云-模型-推理"全栈Agent化升级,同步推出全新AI产品官网"千问云"、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。
千问云是阿里云成立17年来首次在主官网之外推出的全新产品官网,据阿里云介绍,也是国内云厂商率先专门面向Agent(智能体)设计的模型服务入口。而从芯片到推理引擎的这次全栈升级,更是国内云厂商首次围绕Agent进行完整的产品体系发布。
就在不到24小时前,谷歌刚在I/O开发者大会上把开发平台Antigravity升级为agent-first架构,发布了定位为"24/7 personal agent"的Gemini Spark,宣布Gemini从AI助手全面转向自主执行任务的Agent。
谷歌和阿里云在同一天做了同一个判断:云和AI的主要消费者正在从人变成Agent。
智能体作为AI的下一个主战场的判断在全球科技行业已经接近共识,但想要体系化围绕Agent做全栈重构,要求一家公司同时在底层AI芯片、中间层云计算基础设施和前沿大模型三个领域拥有顶级自研能力,芯片决定算力自主性,云决定规模化服务能力,模型决定Agent的智能上限,缺任何一层都交不出完整答卷。放眼全球能同时满足这三个条件的科技公司屈指可数。
阿里云资深副总裁刘伟光在现场表示,Agent突破临界点之后可以24小时不间断工作,对AI和云的需求无穷无尽。"云的用户正在从人变成Agent,而阿里云决定让整套技术体系为此全面重构。"
千问云的设计正是这次全栈变革的一个注脚。网站同时提供了两套入口:人类用户看到的是模型对比、体验和API接入的完整界面,Agent看到的是一条标准化的Skills安装指令,解析后即可获取平台全部能力并根据需求自主调用。
自研芯片走向商用:真武M890与128卡超节点
阿里云本次智能体全栈重构从最底层开始发力。
在芯片层面,阿里发布了基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,128张AI芯片组成一台计算机,P2P时延低于150ns,主打解决Agent场景下的海量并发推理和大模型训练需求。
真武M890拥有144GB显存,片间互联带宽800GB/s,芯片原生支持FP32到FP4多种数据精度,性能是上一代真武810E的3倍。
在阿里云峰会上,平头哥同时首次公布真武系列芯片路线规划,未来两年将陆续推出真武V900、真武J900两代芯片。
目前真武系列AI芯片累计出货56万片,服务了中国电信、中国一汽、浦发银行等20多个行业的400多家客户。
平头哥半导体副总裁高慧表示,Agentic时代一个Agent在执行任务时可能在毫秒间连续发起数十次模型调用,同时需要CPU、GPU、网络和存储紧密协同。平头哥构建全栈自研芯片矩阵,核心是实现算力、网力、存力的系统级协同。
磐久AL128超节点已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流模型。新一代真武芯片由此进入了百炼的对外模型服务链路。
从控制台到一行代码:云平台的Agent化重构
芯片是地基,地基之上,阿里云开始改造云平台本身。
传统云产品的交互逻辑面向人:控制台、菜单、配置项、仪表盘。阿里云CTO李飞飞指出,Agent工作负载是"无规律弹性、短生命周期、瞬时起量即走",与传统云计算的稳态负载截然不同。
阿里云据此对云产品进行了Skill化、MCP化和CLI化改造,每一个云产品都变成Agent可以像调函数一样调用的标准化能力模块。Skills门户同步上线,用户仅需一句自然语言指令,Agent即可完成从资源识别到应用部署的全流程。
千问云是这套逻辑的集中体现。150多款主流模型的API被封装为标准化Skills和CLI工具,OpenClaw、Hermes Agent、Claude Code等主流智能体框架仅需一条指令即可"学会"平台全部能力,根据用户需求自主调用模型、处理图片、生成视频。人类开发者同样可以通过千问云完成模型选型、对比、体验和接入的全流程。
上一次中国头部科技公司以这种力度重构产品入口,可能要追溯到移动互联网早期所有人把PC官网的流量让位给App的阶段。
阿里云还为Agent构建了完整的运行环境支撑,包括轻量高效的沙箱执行环境、多Agent协同能力、跨任务记忆能力,以及全域智能运维能力。
35小时自主进化:旗舰模型从"说得好"到"做得到"
平台为Agent准备了运行环境,Agent能做什么,取决于驱动它的模型。
Qwen3.7-Max是阿里新一代旗舰大模型,在第三方评测机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。
阿里同时披露了一个实战案例。在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立进行了432次内核评估和1158次工具调用,完成了一个生产级AI计算内核的编写与调优,最终性能较SGLang Triton官方参考实现提升10倍。全程没有人类干预。测试轨迹显示,模型在运行超过30小时后仍能发现有效优化点,甚至主动发起了一次架构重设计。
这个案例的含金量需要放在行业语境下理解。芯片级的算子优化,过去是资深AI Infra工程师最核心的工作之一,需要极强的硬件经验、算法能力和反复调试迭代。Qwen3.7-Max在一块从未见过的芯片上完成了这件事,而且结果比官方参考实现好一个数量级。Agent正在从"替人写代码"进入"替人优化硬件性能"的阶段,这个门槛的跨越,比跑分榜上的名次变化更能说明问题。
阿里巴巴通义大模型事业部负责人周靖人表示,大模型正在经历核心范式转移,从对齐人类偏好到对齐任务目标。"过去我们追求的是模型'说得好',现在要求模型'做得到'。"
近3个月内,千问旗舰模型连续迭代了3.5、3.6、3.7三个版本,阿里在刻意加速模型进化,匹配Agent场景对模型能力的指数级需求。据了解,千问3.7系列后续还将推出Qwen3.7-Plus等版本,覆盖从编程智能体到视觉智能体的全场景。
百炼开放与资本验证:增长引擎已经在切换
模型能力到位之后,规模化的问题交给了百炼。
阿里云在百炼平台上构建了大规模GPU资源集群,通过并池调度、上下文缓存、吞吐弹性调度应对Agent场景下的并发挑战。百炼内建安全治理能力,确保24小时不间断运行的Agent始终在预设权限范围内行动。
李飞飞强调,在Agent自主运行的语境下,一个全天候执行任务的Agent如果没有边界约束,后果不可控。
生态策略上,百炼保持开放接入。除阿里自研的千问模型矩阵外,平台已接入智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可灵、Vidu Q3等第三方模型。GLM-5.1、Kimi K2.6、MiniMax M2.7是当下国内最强的几个竞品模型,阿里云把它们全部放上了自家平台。这个动作的逻辑很清楚:阿里云赌的不是千问一家模型赢,是百炼成为Agent调用模型的默认入口。当Agent需要根据任务动态选择最合适的模型时,谁的平台上模型最全、切换成本最低,谁就是Agent的第一站。百炼正在做的是Agent时代的模型超市。
比产品发布更早的信号来自资本市场。上周阿里财报电话会上披露,AI模型及应用服务ARR已超过80亿元,预计年底突破300亿元,消息发布当天阿里股价飙涨8%。截至2026年3月,百炼平台客户数量同比增长8倍,过去三个月token消耗规模较上一季度大幅提升。
按管理层预计,此次全栈升级之后,Agent驱动的MaaS收入将取代ECS成为阿里云最大的产品线。如果兑现,将是阿里云收入结构的一次重大切换。
过去,阿里云卖的是算力时长,企业按小时、按核数付费;现在卖的是Token消耗量,Agent按调用次数和生成长度付费。计量单位变了,增长逻辑也跟着变了:人类有工作时间上限,Agent没有。当Agent开始7x24小时消费Token,云的增长天花板就不再由人类的工作时长决定。按公开数据看,ARR从80亿到年底300亿的增速,在阿里云历史上罕见。
Omdia数据显示,阿里云是国内云市场份额第一的厂商。这样一家公司在这个时间窗口里把芯片、云平台、模型和推理引擎全部围绕Agent重新配置一遍,本身就是一个重要的行业信号。
上一次阿里云做这种级别的技术体系调整,还是2019年全面拥抱云原生的时候。那次重构花了两年消化,奠定了此后五年云原生时代的竞争优势。而在旗舰模型三个月迭代三个版本的AI时代,率先完成全栈重构的速度本身就是壁垒。
- 责任编辑: 陈济深 
-
刚赚到钱的B站,把10亿砸向了AI
2026-05-20 15:50 观网财经-互联网 -
一季度云厂商增长斜率趋缓,涨价影响还在后面
2026-05-20 15:24 人工智能 -
美车主为测试特斯拉涉水模式驶入湖内被困,离岸仅数米
2026-05-20 08:41 -
豪掷24亿押注诊断赛道:广药集团“收编”达安基因
2026-05-19 21:01 观网财经-健康 -
五周内五冠:给张雪一个支点,看看我们撬动了什么
2026-05-19 21:00 产经 科创 -
抖音电商618开售前三日:千万元直播间数量同比增长116%
2026-05-19 20:27 观网财经-互联网 -
菜鸟加码欧美,在美国、德国上线“晚必赔”
2026-05-19 20:27 观网财经-互联网 -
三星奖金被友商吊打?4万多员工不干了!集体罢工逼宫管理层
2026-05-19 20:27 产经 科创 -
京东618的产业效率实验:把AI融入实战
2026-05-19 20:26 观网财经-消费 -
长江存储启动IPO辅导
2026-05-19 17:16 观网财经-科创 -
小巷寻宝——青岛百年里院的烟火与新生
2026-05-19 14:11 -
央视解码君乐宝悦鲜活:郭晶晶与尼格买提探秘高品质中国鲜奶
2026-05-19 14:02 -
张恒和三夫户外:一个“老户外人”的理想主义
2026-05-19 12:01 观网财经-消费 -
禁止去北京上海开店,波比冰淇淋能再造一个“古茗神话”吗?
2026-05-19 09:25 -
华为哈勃等入股光芯片公司
2026-05-18 23:02 观网财经-科创 -
小米卢伟冰:今年一定迭代玄戒芯片
2026-05-18 22:57 观网财经-科创 -
白酒绝地自救:压货减缓,度数下探,分销被砍
2026-05-18 19:54 -
百度Q1财报:AI业务收入占比过半,GPU云收入同比增长184%
2026-05-18 18:06 产业万象 -
拥抱新消费,五粮液敲开年轻人的大门
2026-05-18 17:44 -
莫迪亲赴ASML,带印企买光刻机
2026-05-18 12:33 观网财经-科创
相关推荐 -
科幻走进现实?在太空建电站,中国迈出关键一步 评论 95
美财长吓唬G7:不加税,就等着中国毁了你们吧 评论 90
40项双边协议!克宫介绍普京访华议程 评论 38
“巴基斯坦向沙特部署八千人,派了枭龙和红旗-9” 评论 241最新闻 Hot-
“龃龉不断”,克罗地亚总统拒绝批准以色列新任大使赴任
-
北约最高指挥官:没有制定任何在霍尔木兹海峡行动的计划
-
“中国方案关键指标明显优于美日”
-
对俄烂摊子,欧盟想找“老将”出山
-
科幻走进现实?在太空建电站,中国迈出关键一步
-
法企都放弃了,还想摆脱中国?
-
万斯:美国不能当世界警察
-
热浪滚滚,印度部分地区气温达48摄氏度
-
金融危机以来新高!30年期美债遭抛售,收益率飙升
-
离大谱,“美以本打算扶内贾德上台,空袭是为了解救他”
-
“中欧不为人知的是,真正问题不在中国车上…”
-
欧洲又被无情嘲讽:老把戏,省省!
-
“中国商会向总统直接投诉,说明印尼太过分了”
-
调解方:美伊谈判几乎没有进展
-
“这下欧洲更怕了:美军要彻底抽身?”
-
美议员神逻辑:F-35不卖,芯片也不能卖中国
-

观察员

上海市互联网违法与不良信息举报中心