海豚研究|AI竞赛——电力才是关键?美国无以为继?

撰文: 海豚研究
出版:更新:

2025年,AI发展叙事迎来剧烈转向:随着英伟达Blackwell架构及更高功率算力集群全面部署,数据中心能耗密度呈指数级飙升。高盛预测,到2027年,AI服务器单个机架功率密度,将是五年前普通云服务器的50倍。

这场功耗飞跃,正面撞上北美基建的“硬墙”:一边是每秒万亿次浮点运算的强烈需求,另一边是电网平均机龄超40年、变压器短缺率高达30%、扩建周期长达5至10年的困境。

那么,北美缺电究竟是中短期供需失衡,还是长期问题集中爆发?一个高度成熟的国家,为何会陷入无电可用的窘境?长桥海豚君通过此篇文章来一探究竟。

一、需求端:
制造业回流与AI算力爆发,开启新一轮上行周期

2025年底,美国最大区域电网PJM的容量拍卖价格,从每兆瓦日28.92美元暴涨至269.92美元,9倍跳涨标志市场定价从“风险溢价”转向“生存恐慌”。燃气轮机订单爆发、卡特彼勒与三菱重工激进扩产,本质是科技巨头“弃网自保”,以自备电源绕过瘫痪的公共电网。

面对能源缺口威胁,美国联邦政府在2025年开启史无前例“战备模式”:1月白宫非战时宣布“能源紧急状态”,4月强制电网动用所有能源,“减碳理想”阶段性让位“算力生存”,煤电与气电重归一线,9月能源部启动“电力加速计划”,以行政力量缩短电网项目审批周期。

站在2026年节点,AI变革已扩散至传统行业,引发全产业链重构。纵观美国电力史,用电需求呈“增长—平台—复苏”三阶段。叠加AI数据中心爆发式建设带来的新增能耗,2021至2024年平均增速回升至1.5%,电价自2022年起加速上涨。

(长桥海豚研究提供)

从用电结构来看,商业用电是增长核心引擎,其中数据中心更是绝对主力。截至2024年底,美国数据中心负荷已达约35GW,较2020年实现翻倍;工业用电同步复苏,半导体晶圆厂、动力电池工厂等高阶制造业回流,为用电需求提供坚实的底部支撑。

(长桥海豚研究提供)

核心矛盾:从“总用电量”到“峰值负荷”的挑战

根据NERC数据,美国电网峰值负荷自2006年见顶后长期停滞,导致电网侧的扩容性资本开支长期低迷,北美电网老化严重,平均服役时间已接近40年。

(长桥海豚研究提供)

而AI数据中心的崛起,彻底改变了用电格局:作为具备“超高功率密度”且训练时“近乎24小时满载运行”的新型刚性负荷,其缺乏传统工业负荷的调节弹性,难以参与错峰让电。

一旦需求端“峰值负荷”的增速超过供给端“有效容量”的建设速度,“容量性缺口”将无可避免,最终引爆北美缺电危机,推高电价中枢,并引发大规模停电风险。

而需求爆发的背后驱动因素非常明确:

1. 核心驱动:北美云端服务商(CSP)资本开支的爆发式增长

全球数据中心正经历由生成式AI驱动的历史性扩张周期,以亚马逊、微软、谷歌、Meta为代表的北美四大云端服务商,其资本开支自2023年下半年起进入“军备竞赛”模式,四家厂商的总资本开支从2023年的约1,500亿美元,飙升至2025年预计的4,060亿美元,复合年增长率超60%。

(长桥海豚研究提供)

按长桥海豚君的统计,全球前11大科技巨头的合计资本开支,将从2023年的1,800亿美元,加速增长至2025年的近5,000亿美元。这场“军备竞赛”直接带动上游AI芯片出货量及数据中心规模的持续爆发。

2. 数据中心算力的“暴力美学”:算力 = 电力

随着摩尔定律趋缓,AI芯片进入“高算力推动大能耗”的时代:

单点热密度飙升:英伟达GPU的单芯片热设计功耗,已从H100时代的700W,跃升至Blackwell架构(GB200/GB300)的1,200W至1,400W区间;市场更预期,下一代Rubin架构及其配套超级芯片平台,功耗将进一步突破2,000W,对供电与散热能力提出极致要求。

集群规模指数级扩大:AI大模型的训练与推理需求,推动单个数据中心的部署规模,从“千卡级”迈向“十万卡级”。

(长桥海豚研究提供)

3. AI数据中心:从“潮汐波动”到“刚性满载”

传统数据中心(可调度的弹性负荷):业务以云计算、数据存储和互联网服务为主,具有明显的“潮汐效应”(白天繁忙、夜晚闲置)。服务商透过虚拟化技术与超卖策略,实现多租户间的“错峰复用”,使整体负荷曲线相对平缓,峰值负荷率通常控制在60%以下,为电网侧预留充足的调节与缓冲空间。

AI数据中心(刚性的冲击性负荷):随着AI训练需求爆发,数据中心已转变为电网中必须优先保障的“刚性工业负荷”:

巨观层面,是重塑区域电力基荷的“巨兽”:AI训练集群追求极致的平行效率,一旦启动便持续数周甚至数月近满载运行,峰值负荷率超90%,负荷曲线呈现一条高位直线。

一座GW级项目落地,等同于凭空增加一座中型城市的能耗,瞬间填满区域电网的输电裕度,导致后续并网面临长达数年的排队与扩容瓶颈。

微观层面,是攻击电力系统核心的“毫秒刺客”:由于GPU任务的高度同步性,当集群从“计算”切换到“通信”,或从“闲置”进入“满载”时,会在微秒/毫秒级时间窗口内产生剧烈的功率跳变。

NERC数据显示,某大型数据中心的负荷曾在36秒内由450MW骤降至7MW,相当于瞬间切断一座中型发电厂。这种极高的电流变化率犹如一把“电力重锤”,高频次冲击本已老旧的美国电网,足以引发电压闪变、谐波污染,甚至触发继电保护导致区域停电。因此,部署静止无功发生器(SVG)、超级电容或储能系统,已成为平缓这把“电力重锤”的必要手段。

而长桥海豚君基于目前已在建、规划数据中心进展以及全球云服务大厂资本开支规划测算,再以美国官方电力中心规划来验证,会有一个非常清晰的画面呈现出来:

过去20年,北美市场新增峰值负荷接近停滞,但未来五年计增长140GW上下,其中数据中心基建贡献大约100GW的增量,制造业回流和终端电气化(如电动车等)大约贡献40GW上下。

既然每增1GW就相当于新增一个中型城市的发电量。想像一下,对于这样用电已经稳了数十年的老牌资本主义国家,突然接下来每年要新增25个中型城市的发电量需求,是个什么概念!

现在,关键问题来了,美国的电力基建能跟得上吗?接下来,我们就来详细探讨一下这个问题。

二、供给端:
美国面临能源侧与电网设备侧的双重瓶颈

1. 能源侧(发电侧):有效能源退役多、可靠补位少

过去十年(2014至2024年),美国电力系统的总量虽微幅增长,复合年增长率仅1.2%,但发电结构却发生剧变,为当前的缺电危机埋下了供给侧的病根。

(长桥海豚研究提供)

(1)高可靠性基荷加速“失血”

煤电受环保政策与天然气成本优势双重挤压,近年加速退役,装机量从2011年318GW减至2024年174GW,发电端占比由30%收缩至14%,削弱电力系统基础保障。

天然气凭美国页岩气革命的成本、灵活性及清洁优势,装机稳增,占比长期逾40%,从调峰能源成主力“压舱石”。

但截至2025年,“火、水、核”等传统高可靠基荷能源总装机,较2011年仍减少77GW,电力系统可靠性根基持续受损。

(长桥海豚研究提供)

美国逾50%的优质基荷电源(火、水、核)共528GW,服役已超30年,自2010年起便进入火电退役高峰。据美国能源信息署(EIA)预测,2020至2030年当地每年基荷机组退役量均多于新增量,在AI需求爆发前,电力系统的“可靠容量”已持续净流失。

(长桥海豚研究提供)

(2)增量错配:风光“电量替代”无法填补“容量窟窿”

弥补煤电空缺的,并非同为高可靠的基荷能源,而是以风电、光伏为主的间歇性能源。然而,这种“替代”仅是“电量”替代,而非“容量”替代——即风光在天气晴好时能产生大量廉价电力,却无法在电网最需要的峰值时刻,提供稳定的有效电力。

(长桥海豚研究提供)

(3)波动电源补位,与AI刚性需求根本冲突

AI 数据中心需 24 小时稳定供电,属刚性负荷,但新增电源以间歇风光为主,加之美国跨区电网脆弱,中西部风电难输送至东海岸 AI 集群,加剧局部供需失衡。

风光有效容量系数“打折”,光伏仅10-20%、风电30-40%,远逊基荷能源的80-90%,间歇波动导致可靠性不足;同一区域风光装机越多,有效容量越边际递减,顶峰负荷保障力越弱。

AI数据中心需24小时稳定供电,属刚性负荷,但新增电源以间歇风光为主,加之美国跨区电网脆弱,中西部风电难输送至东海岸AI集群,加剧局部供需失衡。

(长桥海豚研究提供)

基于美国能源信息署(EIA)、北美电力可靠性委员会(NERC)及美国能源部的规划指引,长桥海豚君对2026至2030年发电能源的新增供给做出以下预测:

2026至2030年这5年间,美国新增电力装机容量为337GW,其中光伏和风电等间歇性电源贡献了超过76%的增量,约257GW;而具备稳定、可调度能力的天然气发电新增量仅80GW,占比约24%。

然而,同期计划退役的机组高达92GW,且几乎全部为高可靠性基荷电源,其中煤电约76GW,气电约13GW。这意味着,在净新增的245GW装机中,稳定电源的净贡献微乎其微,电力系统仍在持续“失血”。

由于不同电源在电网顶峰时刻的可靠出力(有效容量)贡献差异巨大,长桥海豚君对上述净增245GW装机按有效容量系数折算(煤/气/核/水/风/光分别取90%/90%/95%/80%/40%/10%),结果显示,未来五年美国电力系统新增的有效净容量仅约28GW。

换言之,美国近换言之,美国近90%的名义装机增量,在电网最危急的顶峰时刻,无法转化为可靠的电力保障。

(长桥海豚研究提供)

(4)供需差:可靠性缺口巨大且确定

长桥海豚君假设未来电力系统的备用率与2024年持平,维持15%的水准,结合需求端AI负荷的爆发态势,预测到2030年,美国电力系统将出现巨大的可靠性缺口,在低、中、高需求情景下,缺口规模预计将分别达到109GW、149GW和195GW。

(注:储备裕度 = (有效总容量 - 峰值负荷)/ 峰值负荷,行业基准线通常设定为15%,旨在确保电力系统在机组故障、需求预测误差或极端气候等“最差情景”下,仍具备足够的可靠性容量作为缓冲。)

由此可见,美国电力系统正陷入“账面繁荣,实则虚弱”的困境:风光装机的名义容量高速增长,创造了“绿色转型”的表象,但其极低且持续递减的有效容量,既无法填补传统基荷退役留下的“可靠性窟窿”,更无法支撑AI驱动下顶峰负荷的爆炸式增长,最终导致系统可靠容量的绝对短缺,这也是当前北美缺电危机的主要根源。

2. 电网侧(输电侧)

美国的缺电危机并非单纯的发电侧问题,输电侧同样面临严峻挑战,老化的电网基础设施,已无法承受AI数据中心这些“用电巨兽”的冲击。

(1)物理瓶颈——老化的电网无力承受“用电巨兽”

美国电网的建设时间较早,电网结构在20世纪中期已基本成型。据美国能源部(DOE)统计,美国70%的输电线路以及电力变压器,运行年限已超35年;约30%的核心资产(含断路器等)已突破设计寿命,电力系统的可靠性已大幅减弱。

电网投资长年偏低,2000年后用电增长放缓、设备制造业空心化且所有权分散,过去十年年均投资仅200至300亿美元,2024年才突破300亿,且资金多投向老旧设施更换,扩容投资占比极低。

2024年新增345KV及以上高压输电线路仅888英里,不足规划两成。高度定制化的电力变压器扩产困难,美国本土供应率仅30%,2025年短缺率约30%,交付周期延至2至3年,直接阻碍电网快速扩容。

(2)新增冲击——“劣质负荷”压垮最后一根稻草

当单个达到数十万、上百万千瓦(GW级)的AI数据中心提出并网申请时,其巨大的瞬时功率需求,已超出区域电网的物理承载极限。

单座高密度AI数据中心的负荷,相当于数座中型城市,不仅会瞬间耗尽局部电网的剩余输电容量,更会迫使电力运营商启动从变电站到输电互联网的全套升级。

同时,AI算力负荷在毫秒间的剧烈跳变,会对老旧电网产生高频干扰,威胁区域供电安全。为评估此类风险,电网运营商不得不延长“系统影响研究”流程,进一步导致并网流程淤堵。

(3)核心矛盾——“建设周期”的毁灭性错配

正是由于上述物理瓶颈,引发了最致命的“时间错配”:AI数据中心的理论建设周期仅需18至24个月,然而配套的输电网扩容及跨区域线路建设,受许可审批、环境评估及长周期设备(如变压器)交付的限制,往往需要5至7年甚至更久。

尽管美国联邦能源监管委员会透过2023号命令简化了行政审批,理论审批周期仅1至2年,但“物理扩容不足”导致的并网队列拥堵愈演愈烈。目前,全美电网并网排队的中位数已接近5年,在北弗吉尼亚州等数据中心核心区域,接入等待时间甚至飙升至7年。

这种时间错配对数据中心运营商而言是毁灭性的:即便数据中心在1至2年内建成,其耗资数亿美元采购的GPU芯片,也会因无电可用而迅速贬值,高昂的沉没成本(折旧)将直接侵蚀企业利润,导致AI投资的投资回报率(ROI)模型彻底崩溃。

(长桥海豚研究提供)

小结:缺电是结构性矛盾

综上分析可见,美国当前的电力短缺绝非短期的供需失衡,而是AI算力爆发,与能源、电网基建长期滞后形成的结构性矛盾。

需求端,制造业回流与AI数据中心刚性负荷的双重驱动,使电力需求进入加速增长通道,峰值负荷压力陡增;供给端,传统高可靠基荷电源持续退役,风光能源的“电量替代”难以填补“容量缺口”,有效供电能力严重不足;电网侧,设施老化、投资缺位、关键设备短缺与建设周期错配,进一步放大了电力供需的矛盾。

作者长桥海豚研究,专注有灵魂的思考、有态度的研究。

文章仅属作者意见,不代表香港01立场。

01专栏精选不同范畴专家,丰富公共舆论场域,鼓励更多维度思考。