-
霍丹·奥马尔:用AI写100字邮件等于耗半升水?“数据中心焦虑”偏离了方向
关切四:AI工作负载威胁电网供电可靠性
对电网可靠性的担忧往往是高度本地化,而非系统性的。电力中断和设备故障通常发生在变电站、馈线或变压器等特定瓶颈节点,这些老旧基础设施的设计初衷并非应对快速、集中的负荷变化。尽管AI需求的规模给这些资产带来了基础性压力,但数据中心仅是覆盖交通、建筑和工业等更广泛电气化浪潮中的贡献者之一(如关切一所述)。
AI工作负载带来的更具独特性的可靠性挑战,源于其用电行为本身的特性。图6展示了谷歌提供的时序数据,直观呈现了这种动态。
图6:AI工作负载的功耗时间序列图
图中纵轴为数据中心功率,横轴为时间。数据显示,AI工作负载造成了接近15兆瓦的负荷波动,导致功率从约1兆瓦飙升至15兆瓦。这种波动源于图形处理器的同步运算。在任务执行期间,所有图形处理器以紧密协同的方式工作。这导致在活跃计算阶段功耗极高,而在图形处理器等待数据或彼此同步时,功耗则出现短暂、急剧的下降。这意味着电力输送系统必须按照远高于平均水平的峰值来规划容量。
因此,对于AI工作负载因极度波动性而影响电网可靠性的担忧,特别是其行为维度,是政策制定者应当正视的有效关切。
AI可靠性风险因工作负载类型而异
实践中,AI工作负载主要分为训练和推理两大类别,二者与电网资产的互动方式存在根本性差异。分别审视这两类负载,可以清晰揭示其负荷特性如何转化为对电网基础设施的不同压力,以及可靠性风险实际源于何处。
训练工作负载是一个有限过程,一旦模型达到目标精度水平即告结束。训练期间,图形处理器经历若干不同阶段。在正向传播阶段,图形处理器以持续的高功耗处理数据。紧随其后的是反向传播阶段,模型更新参数,功率需求以短脉冲形式激增。系统还会周期性进入检查点阶段,即模型保存进度的短暂停顿,期间功耗急剧下降,如同电子游戏中的暂停画面。即便如此,图形处理器也并非完全闲置。它们通常维持较高的基线负载,约为峰值的60%至70%,以便能立即恢复计算。
持续高负载、快速尖峰和部分闲置之间的反复转换,形成了AI训练特有的“锯齿形”功率曲线。阿尔伯塔大学的李玉琢和李运帷在2025年发表的论文《AI负荷动态:电力电子视角》中对此进行了阐释。研究者在微调OpenAI的GPT-2模型时测量了检查点事件期间的图形处理器功耗,并生成了功耗随时间变化的时序记录。数据显示图形处理器功耗处于闲置状态,然后突然跃升至一个高位、参差不齐的活动平台(如同锯齿刀刃),随后又骤然回落——这一模式在整个训练运行期间反复出现。对电网运营商而言,这一模式之所以重要是因为它引入了频繁且陡峭的负荷转换,而非平滑或可预测的需求曲线。
与锯齿形负荷曲线相关的主要可靠性风险是热循环。变压器本质上是一个装满绝缘油、内含铜绕组的大型容器。当数据中心汲取巨大的兆瓦级电力时,铜绕组升温并物理膨胀。当工作负载到达检查点、需求急剧下降时,绕组冷却并收缩。在AI训练环境中,这种加热与冷却循环每天可能发生数十次。反复的膨胀与收缩对铜绕组及其周围的绝缘纸施加机械应力,逐渐导致材料变脆、开裂。这一过程被称为“热疲劳”,其原理如同反复弯折回形针直至将其折断——导致断裂的并非总重量,而是重复运动。这些转换可能使变压器在数月内承受相当于数年的机械疲劳累积。
相比之下,推理工作负载并非有限任务,而是持续进行的服务。用于推理的图形处理器在等待用户请求时处于低功耗闲置状态。当请求到达时,图形处理器迅速爬升至接近峰值功率以尽快处理请求,任务完成后随即回落。这一循环不断重复,产生的是短促的高功率脉冲,而非持续负荷。
李玉琢和李运帷还研究了Meta的Llama 3.1模型运行推理操作时的功耗模式,发现功率消耗在闲置与峰值之间以几分之一秒的周期循环往复。推理的显著特征并非其平均功率需求,而是这些负荷变化的速度与频率。其模式是在高、低功耗间快速闪烁,从未完全稳定,这与训练工作负载和传统数据中心计算均显著不同。
对于推理工作负载,主要压力落在电网的电子控制系统上——即那些维持电压稳定并决定何时为安全起见切断电路的设备。AI推理请求的急速激增可能导致被称为“电压暂降”的电压瞬时跌落。可将电网试想成水管:若有人每半秒就突然猛开一个巨大阀门又猛然关闭,整个管道系统的水压便会剧烈波动。在电网中,这种不稳定的压力可造成两类具体损害。首先,它可能导致电子疲劳,因为变电站的传感器和电容器被迫每天数千次对抗这些毫秒级速度的压力波,致使其内部元件过早老化。其次,由于这些AI尖峰的速度和强度酷似短路,电网的自动安全断路器可能被误导而跳闸,造成误报性停电。
政策制定者应激励数据中心内化波动成本
为保护美国电力系统的可靠性,政策制定者应建立激励机制,奖励数据中心内化其负荷波动所带来的成本。这些激励应特别针对电网基础设施面临的两大关键物理风险:热疲劳和电压不稳定。
首先,监管机构应奖励使用先进软件来协调计算任务、降低峰值电力压力的行为。例如,谷歌的DeepMind已应用AI来优化其数据中心所需的海量电力。通过持续分析与服务器负载、电力分配以及冷却设备(如泵、冷却机和冷却塔)能耗相关的大量电气数据,其AI系统学会了进行精确的实时调整,以更高效地运行这些系统。仅此一项能力就使冷却能耗降低了40%,转化为数据中心整体功耗下降15%。同样,Emerald AI等初创公司已证明,软件“中介”可在电网承压高峰期令AI集群的功耗降低25%,且不违反性能保障承诺。
其次,监管机构应激励使用现场缓冲装置以维持电压稳定。以微软为例,该公司已开始在其较新的园区推广此类技术。传统上,数据中心电池大部分时间处于闲置状态,等待停电时启用。微软的系统则重新利用这些大规模锂离子电池组,以实时响应电网需求。凭借约80毫秒的反应时间,该设施可从电池“汲取”电力以稳定电网频率,或“吸收”由AI工作负载突发引起的微尖峰。
遗憾的是,尽管上述案例证明了技术上的可行性,但现有政策框架对于大规模鼓励此类行为作用甚微。《AI行动计划》呼吁数据中心通过更优化的管理技术、输电升级改造以及大型用户在关键时段管理用电的新方式,“尽可能优化现有电网资源”。但该计划止步于创建具体的激励机制或性能标准,未能奖励数据中心投资于内部负荷平滑、功率变化率控制或增强可靠性的电力管理。
政策制定者不仅应将经过验证的负荷曲线管理视为一种支撑电网的服务并据此设计激励措施,还应支持由数据中心运营商、公用事业公司和区域输电组织合作制定的行业行为准则,明确界定现场缓冲、负荷平滑和功率变化率控制的标准。国会应指示联邦能源管理委员会将对准则的遵守作为获得有利并网条款的条件,同时财产险和营业中断险的承保人应向证明合规的运营商提供更优惠的保费——由此形成并行的监管与市场压力,共同推动该准则的大规模采用。
关切五:AI工作负载给地方水资源带来压力
根植于热力学的一个现代计算基本事实是,处理器消耗的几乎所有电能最终都转化为热量。随着AI工作负载的功耗日益增加,排热挑战已成为数据中心设计的核心约束。数十年来,大多数设施依赖风冷系统,使用大量经过调节的空气来散发热量。在服务器功率密度较低时,该方法是可行的。但对于热量产生强度更高、空间更集中的现代AI硬件,风冷已日益力不从心。
为应对这些热负荷,数据中心运营商正迅速转向液冷系统。水及其他专用冷却液在吸收和带走高密度AI服务器的热量方面,效果远优于空气。这一转变提高了能源效率,并使更高性能的计算成为可能。但它也引发了环境关切,尤其是围绕水资源的使用。
这些关切可分为两个相关类别。第一类是地方性和生态性的。液冷系统可能增加特定地点的取水量,引发人们对与市政供水、农业或当地脆弱生态系统相竞争的担忧,尤其是在水资源紧张地区。社区担心大型数据中心可能加剧缺水状况、给基础设施带来压力,或将水资源从基本用途中分流。
第二类关切是系统性和认知层面的,焦点在于水资源的使用如何与AI活动关联呈现。媒体报道越来越多地将数据中心的耗水量转化为生动的单次任务类比,将日常AI使用描绘为对环境的一种浪费。《华盛顿邮报》2024年9月一篇题为《每封邮件一瓶水:使用AI聊天机器人隐藏的环境代价》的文章引用估算数据称,训练GPT-3的耗水量堪比生产100磅牛肉所需的水量,而Meta训练其LLaMA-3模型估计使用了2200万升水,文章将其等同于生产超过4000磅大米。对于AI使用,文章引用估算称,用GPT-4生成一封100字的电子邮件所需能耗,大致相当于半升水。
与关切二中讨论的“抢占电网”批评颇为相似,这些比较将AI的资源使用框定为本质上低价值或社会性浪费,隐晦地质疑AI的益处是否值得消耗稀缺的自然资源。
-
本文仅代表作者个人观点。
- 责任编辑: 郭涵 
-
当增长失效,太平鸟在“重做”一家公司
2026-04-21 12:48 观网财经-消费 -
36年积淀,6年淬炼,归元S和魏牌V9X为中国豪华立全球标准
2026-04-21 12:04 观网财经-科创 -
上市4个月卖不到10万台,三星三折叠被曝将退市
2026-04-21 10:49 观网财经-科创 -
苹果的“库克时代”即将落幕,特努斯将接掌“4万亿帝国”
2026-04-21 07:46 观网财经-科创 -
36年后,六神拿出“小六神”
2026-04-21 02:22 观网财经-健康 -
余承东:华为Pura90系列平均成本上涨1500元,扛不住可能涨价
2026-04-20 18:09 观网财经-科创 -
灵光上线“灵光圈”, 打造人人可用的Coding Agent
2026-04-20 17:17 观网财经-互联网 -
阿里发布世界模型HappyOyster,与谷歌Genie3竞争
2026-04-20 17:16 观网财经-互联网 -
腾讯发布并开源混元3D世界模型2.0,一句话造出3D世界,兼容游戏引擎
2026-04-20 17:15 观网财经-互联网 -
爱奇艺发布纳逗Pro平台、新爱奇艺号和分账新规,助力AIGC影视创作者起步
2026-04-20 16:08 观网财经-互联网 -
投资之禾,开云到底还是放不下中国
2026-04-20 15:12 观网财经-消费 -
中国移动集采6万台服务器,ARM处理器占比升至65%
2026-04-20 12:51 观网财经-科创 -
小米徐洁云回应“雷军被堵车里”:造谣的等着
2026-04-20 12:20 观网财经-科创 -
从蓝帽子溯源到合规破局,东方甄选6款自营保健食品获国家认证
2026-04-20 09:35 -
长江存储加速扩产,单季收入被曝超200亿元
2026-04-20 06:34 观网财经-科创 -
亦庄半马深度观察:50分26秒,一场炸裂的“无用之用”
2026-04-19 16:57 观网财经-科创 -
速卖通Brand+背后的中国怪物房出海逻辑
2026-04-19 16:09 产经 出海 -
中国机器人租出海,一天6000美元?
2026-04-19 14:45 产经 科创 -
高德首款具身机器人亮相马拉松大赛
2026-04-19 14:15 观网财经-互联网 -
DeepSeek终于要融资了,估值100亿美元合理吗?
2026-04-18 12:02 观网财经-互联网
相关推荐 -
最新闻 Hot
-
慌什么?中国出新规保供应链,欧美商会坐不住了
-
伊朗将恢复往返中国航班,我使馆:暂勿前往
-
“看过电影不?这种情况只在中美,欧洲不太行”
-
“俄日大战”:语言墙塌了后,日本怎么老惹众怒?
-
伊媒发布反击目标清单
-
盯上红海航道,美国想拉拢这个非洲神秘小国
-
“斯里兰卡要用人民币买俄油”
-
印尼外长来灭火:不会收费的
-
“中国AI算力惊人,高出预估6000倍”
-
首次公布!伊朗蒙面士兵扣押集装箱船
-
阿斯麦傻眼,最大的客户说:太贵了,旧的先用着…
-
NASA这一梦想,将被中国率先实现?
-
南京地铁,通到安徽了
-
印度小伙捏了个“MAGA辣妹”,骗惨特朗普粉丝,“又蠢又好骗”
-
特鲁多突然炮轰美国:把加拿大推向中国
-
美国想挺美,“踢走伊朗队,复活意大利”
-

观察员





上海市互联网违法与不良信息举报中心