-
黄仁勋:推理拐点已至,2027年AI芯片将带来万亿美元收入
过去两年的计算量,在座的各位都知道,对英伟达GPU的需求已经爆表。现货价格飙升,你想买都买不到。与此同时,我们正在出货海量的GPU,而需求仍在不断攀升。原因就在于这个根本性的拐点:AI终于能够做富有成效的工作了。因此,推理的拐点(Inference Inflection)已经到来。
AI现在为了思考必须推理(inference);为了行动必须推理;为了阅读必须推理。AI的每一个部分——每一次思考、每一次推理、每一次行动、每一次生成Token——都需要推理。它早已超越了训练阶段,进入了推理的领域。
当Token数量和所需算力增加了约10,000倍时,推理的拐点也随之到来。如果我将这两个因素结合起来:过去两年,工作的计算需求增长了10,000倍,而使用量可能增长了100倍。你们可能听我说过,我相信过去两年计算需求增长了100万倍。这是我们所有人的感受,是每家初创企业的感受,是OpenAI的感受,也是Anthropic的感受。如果他们能获得更多的算力,就能生成更多的Token,收入就会增加,更多人就能使用它,AI也会变得更先进、更聪明。
我们现在处于一个积极的飞轮系统中。我们迎来了那个时刻,推理的拐点已经到来。
去年的这个时候我说,站在当时的时间点,我看到了通过2026年对Blackwell和Rubin架构高达5000亿美元的高置信度需求和采购订单。我去年就这么说过。现在我不知道大家是否感同身受,但5000亿美元是一笔巨款。没人感到惊讶?我知道你们为什么不惊讶,因为你们大家都度过了创纪录的一年。
但我今天要告诉你们,就在GTC DC结束几个月后,距离去年GTC一年后的今天,站在这里,我看到直到2027年,至少有1万亿美元的市场。这合理吗?接下来的时间我将专门讨论这个问题。事实上,时间可能还不够。我确信计算需求将远高于此,原因如下:
首先,去年我们做了大量工作。如你们所知,2025年是“推理之年”。我们要确保不仅在训练和后训练方面表现出色,而且在AI的每一个阶段都极其出色。这样,投入到我们基础设施中的投资就能尽可能长久地扩展使用。英伟达基础设施的使用寿命将很长,因此成本将极低。使用时间越长,成本越低。毫无疑问,英伟达的系统是世界上成本最低的AI基础设施。
去年的一切都围绕着“AI用于推理”,这推动了这个拐点的到来。同时,我们非常高兴地看到Anthropic选择了英伟达,MSL、Meta SL也选择了英伟达。作为一个整体,这代表了全球三分之一的AI算力。开源模型已经达到了接近前沿的水平,并且无处不在。
如你们今日所知,英伟达是世界上唯一一个能运行AI所有领域的平台。无论是语言、生物学、计算机图形学、计算机视觉、语音、蛋白质、化学物质、机器人还是其他领域,无论是边缘还是云端,任何语言,英伟达的架构都能通用,并且表现卓越。这使我们成为成本最低、置信度最高的平台。
当你在构建这些系统时——正如我提到的,1万亿美元的基础设施投入巨大——你必须完全有信心,这万亿美元的投资会被充分利用,性能卓越,极具成本效益,并且拥有尽可能长的使用寿命。在英伟达平台上进行基础设施投资,你可以拥有完全的自信。我们已经证明,这是世界上唯一可以让你在任何地方、以任何方式构建并充满信心的基础设施。你想把它放在任何云上,我们很高兴;你想本地部署,我们很乐意;你想放在任何国家、任何地方,我们都全力支持。
我们现在是一个能运行所有AI的计算平台。我们的业务已经开始显现这一点:60%的业务来自超大规模云厂商(前五大)。然而,即使在这前五大超大规模云厂商中,有一部分是内部AI消费。内部AI消费是非常重要的工作,比如推荐系统正从基于表格的协同过滤和内容过滤,转向深度学习和大语言模型;搜索也在转向深度学习和大语言模型。几乎所有这些超大规模的工作负载都在向英伟达GPU极其擅长的工作负载转变。
除此之外,因为我们与每一个AI实验室合作,加速每一个AI模型,并且拥有一个庞大的AI原生企业生态系统,我们可以将它们带到云端。无论投资规模多大、速度多快,这些算力都会被消耗掉。这构成了我们60%的业务。
剩下的40%则无处不在:区域云、主权云、企业工业、机器人、边缘、大型系统、超级计算机系统、小型服务器、企业服务器……系统数量惊人。AI的多样性即是其韧性,AI的覆盖范围即是其韧性。毫无疑问,这不是一项单一应用技术,这是基础性的,这绝对是一次新的计算平台转移。
我们的工作是继续推进技术。我去年提到的最重要的一点就是我们的“推理之年”。我们倾尽所有,冒了巨大的风险进行重塑。当Hopper架构正处于巅峰、运转良好时,我们决定必须将Hopper架构和NVLink 8提升到下一个水平。我们完全重新设计了系统,将整个计算系统解耦,创造了NVLink 72。它的构建方式、制造方式和编程方式都发生了彻底的变化。Grace Blackwell搭配NVLink 72是一个巨大的赌注,对任何人来说都不容易。我要感谢在座的许多合作伙伴,感谢你们的辛勤工作。
NVLink 72引入了NVFP4,不仅仅是FP4精度。FP4是一种完全不同的张量核心和计算单元。我们现在已经证明,我们可以进行无损精度的NVFP4推理,同时获得巨大的性能和能效提升。我们也能够将NVFP4用于训练。
伴随着NVLink 72和NVFP4,我们还发明了Dynamo Tensor、RTLLM等一系列新算法。我们甚至构建了一台超级计算机来帮助我们优化内核和优化整个软件栈,我们称之为DGX Cloud。我们投入了数十亿美元的超级计算能力,来创造使推理成为可能的内核和软件。
结果汇聚在一起。人们曾经告诉我:“Jensen,推理很简单。”不,推理是终极的困难(Inference is ultimate hard)。但它也是终极的重要,因为它驱动着你的收入。
-
本文仅代表作者个人观点。
- 责任编辑: 郭涵 
-
可搭载10人!国产AC332直升机,有关键进展
2026-03-13 17:23 -
为什么欧美没有“养龙虾”的热潮?
2026-03-13 17:17 人工智能 -
全民养虾,为什么是中国
2026-03-10 08:39 心智观察所 -
今年将发射,嫦娥七号新任务:月球找水
2026-03-09 19:46 嫦娥奔月 -
长征八号甲遥八火箭转运至发射区,近期择期发射
2026-03-07 16:49 航空航天 -
我国科学家造出1纳米“记忆开关”
2026-03-07 11:01 科技前沿 -
“十五五”末,AI相关产业规模将超10万亿元
2026-03-06 15:28 人工智能 -
科技部部长:去年基础研究投入比重首次破7%
2026-03-05 14:02 2026两会 -
我国硬骨鱼类研究新突破!填补“从鱼到人”演化空白
2026-03-05 06:44 科技前沿 -
全国政协委员刘永好:农业也要积极拥抱AI
2026-03-03 16:26 2026两会 -
靳常青获国际超导领域最高奖
2026-03-03 15:50 科技前沿 -
效率突破15%!我国新一代太阳能电池有新进展
2026-02-26 22:17 科技前沿 -
默茨参访宇树,现场视频来了
2026-02-26 18:53 -
对AI的最新恐惧,一份“假设性”报告如何让美国股市狂泻
2026-02-26 08:37 心智观察所 -
中科院停止支付,涉30种外刊
2026-02-25 15:59 -
我国量子计算新突破!全球首个,开放线上下载
2026-02-25 15:01 -
“欧洲病夫”叩响宇树科技的门
2026-02-25 13:33 心智观察所 -
DeepSeek使用英伟达最先进芯片训练AI模型?外交部回应
2026-02-24 15:55 -
中国AI突破数学经典难题,回答300多年前“牛顿之问”
2026-02-15 14:20 -
相关推荐 -
“他拒绝了两个中间国的停火建议:美以必须先低头” 评论 75
印度执行美国制裁扣船,伊朗来翻旧账了 评论 64
特朗普扬言“为所欲为”,美国要对他下手? 评论 148
美方澄清:“特朗普威胁推迟访华”不实 评论 106
特朗普破防:这么点忙,都不帮? 评论 254最新闻 Hot-
果然有人跳脚,“印太装备都霍霍光,拿什么震慑?”
-
又被点名!“韩国进退两难,转头看向日本…”
-
逮着斯塔默不放:堂堂一个首相,这点儿事做不了主?
-
与美贸易协议无效?马来西亚贸工部:部长说错话了
-
特朗普“打包票”:以色列不会动用核武器
-
对古巴蠢蠢欲动,特朗普:“解放”或“接管”都行,我为所欲为
-
特朗普扬言“为所欲为”,美国要对他下手?
-
“福特”火灾如此严重:超30小时才灭,600多人无床可睡
-
护航帮不上忙,芬兰来和稀泥了
-
美方澄清:“特朗普威胁推迟访华”不实
-
老套路了!“但终有一天账单要自己付”
-
“韩国怀疑:为美国搞砸对华关系,错付了”
-
蒋超良被提起公诉
-
英伟达联手韩国:可不能让全球对中国技术上瘾
-
特朗普破防:这么点忙,都不帮?
-
众叛亲离!“谢邀,又不是我们挑起的战争”
-

观察员
上海市互联网违法与不良信息举报中心