海豚研究|英伟达GTC——AI业界盛典,满心期待扫兴而归?
备受瞩目的AI业界盛典——英伟达GTC 2026大会于3月16日重磅登场,创始人兼CEO黄仁勋发表主题演讲,议题涵盖CUDA平台20周年、推理拐点与算力需求爆发、Vera Rubin系统架构、Groq集成、OpenClaw代理革命及物理AI与机器人等核心议题。然而,大会结束后,市场反应平淡,万亿营收展望虽符合预期,却未带来惊喜,难解股价长期震荡之困。究竟这场科技盛宴藏着哪些关键信号?
一、GTC 2026核心要点
1. 数据中心营收展望:2025-2027年数据中心累计收入目标达1万亿美元(去年GTC大会给出的2025-2026年累计收入为5,000亿美元),与市场预期一致。目前市场主流预期已超过1万亿美元,投资者更期待公司披露订单等具体落地信息。
2. 性能与成本优势显著:在tokens/watt(吞吐量)与token速度(智能度)两大核心维度,英伟达均拿下全球最高性能;同时,其token成本亦为全球最低,技术与性价比优势难以撼动。
3. 数据中心化身“token工厂”:每个数据中心受功率限制(如1GW),需精确管理token生产的吞吐量与速度。token将如同大宗商品般细分层级,从免费层(高吞吐、低速度)到150美元/百万token的顶级层(低延迟、高带宽算力),共分五个等级。
以1GW数据中心为例,每25%功率对应一个token层级:Grace Blackwell相较Hopper可创造5倍收入,Vera Rubin系统则能在此基础上再提升5倍。
4. Vera Rubin系统升级:在原有6类芯片基础上,新增Groq 3 LPU,带来多重突破:
(1)100%液冷设计(45°C热水冷却),取消所有线缆,安装时间从两天缩短至两小时;
(2)CPO(共封装光学)Spectrum-X交换机已全面量产,与台积电联合研发;
(3)推出全球唯一使用LPDDR5的数据中心CPU,支持独立售卖,有望成为数十亿美元级业务;其中Vera CPU Tray用于智能代理工作负载,单个Vera Compute Tray集成8颗Vera处理器(每颗88核),支持8通道LPDDR5x内存,单个插槽内存带宽达1.2TB/s,并集成2块BF4-DPU;
(4)已在微软Azure上线运行(首个机架),供应链支持每周生产数千套系统,每月可提供数GW级AI工厂产能;
(5)Rubin Ultra变体:Rubin采用横向滑入机柜设计,Rubin Ultra需垂直放入新型机架Kyber,144颗GPU置于同一NVLink域内,中板后方用NVLink交换机替代铜缆。
5. Groq 3 LPU(新增芯片):技术源自收购的Groq团队,Groq LP30由三星制造,预计三季度发货。单颗Groq芯片配备500MB SRAM,相较单颗Rubin芯片的288GB存储,无法有效承载主流模型参数和KV Cache在计算核与内存之间的高速传输与交换,因此英伟达推出Dynamo软件,把推理步骤分解出来:
(1)预填充阶段(Prefill):批量处理用户输入Prompt,以计算为主,在Vera Rubin上完成;
(2)解码的注意力环节:计算当前token与历史tokens(KV Cache)的关系,计算与存储并重,同样在Vera Rubin上完成,频繁调用Rubin的HBM内存;
(3)解码的前馈网络(FNN):基于上下文关系输出下一个token概率分布,需反复读取模型权重参数,原存储于HBM中存在“内存墙”瓶颈,现将大部分模型参数转移至Groq的SRAM上,利用其超低延迟特性解决推理速度问题。
Rubin与Groq通过以太网紧密耦合,RDMA特殊连接模式可使两芯片交互延迟降低约一半。
6. Feynman全新架构:整合全新GPU + LP40(LPU)+ Rosa CPU(以Rosalind命名)+ BlueField-5 + CX10,支持Kyber铜缆与Kyber CPO混合扩展(首次实现双模式并存)。
尽管英伟达长期看好CPO方案,但客户倾向于将铜缆方案发挥到极致后再切换CPO(部署与维护更简便)。
7. 其他讯息:
(1)太空数据中心:针对能源短缺问题,推出Vera Rubin Space-1,计划将数据中心部署至太空(需解决辐射与散热难题,太空中仅靠辐射散热,无传导与对流);
(2)OpenClaw代理革命:每家SaaS公司有望转型为GaaS公司(Agent-as-a-Service)。代理系统可访问企业敏感信息、执行代码并对外通信,需具备企业级安全防护。英伟达与OpenClaw创始人Peter Steinberger合作推出NemoClaw(OpenClaw企业安全参考设计),集成OpenShell技术,包含网络护栏与隐私路由器,可连接各SaaS公司的策略引擎;
(3)物理AI与机器人:自动驾驶领域,比亚迪、吉利、现代、日产等车企加入Robtaxi布局,并与Uber达成合作;机器人领域,KUKA、ABB等厂商及众多无人机平台纷纷参与,生态持续扩大。
总体而言,本次发布会除明确铜缆与CPO将并用外,核心亮点是服务器新增Groq的LPU选项——这在Groq被收购后,市场已形成充分预期;即便三年万亿美元收入指引,市场实际预期也已超越该数字。
从产品迭代逻辑来看,英伟达近年重心已从芯片微架构创新转移:从Hopper到Blackwell,解决的核心是组合与连接问题,完成了从“卖芯片”到“卖系统与服务”的转型;从Blackwell到Rubin,无论新增DPU(NAND芯片)还是收购后加入的LPU(SRAM),核心目标都是解决AI进入推理与智能代理时代面临的“内存墙”难题。
二、英伟达的近况:大会指引平淡,亟待成长性新故事
近半年来,英伟达股价始终在170-200美元区间震荡,即便下游大厂增加资本开支、公司业绩持续超预期,股价仍未能实现向上突破,核心源于市场三大担忧:
1. 大厂资本开支的持续性:Meta、谷歌等厂商已明确增加2026年资本开支,四大核心云厂商2026年资本开支有望突破6,600亿美元,同比增长60%。但需注意的是,大厂资本开支占收入比重已处于相对高位,以Meta为例,2026年资本开支预计达1,150-1,350亿美元,占年度收入比例超50%,进一步提升空间有限。即便厂商上调2026年投入展望,市场对后续资本开支增长的持续性仍存疑虑。
2. AI芯片市场份额面临稀释:当前英伟达在AI芯片市场的份额高达75%以上,较高的产品定价与“近乎垄断”的市场格局,促使下游云厂商积极寻求“替代方案”。除谷歌外,博通(AVGO)已收获Anthropic、OpenAI等客户的大额订单,众多客户也陆续启动自研方案。即便英伟达后续推出Rubin新产品,市场普遍预期其AI芯片市场份额将逐步下滑。
3. 产品竞争力面临挑战:目前谷歌TPUv7在FP8等领域的表现已接近英伟达B200(2024年四季度量产),整体差距缩小至约一年。英伟达在Blackwell系列中引入NVFP4格式,使推理性能在FP8基础上翻倍,但FP8已能满足当前市场大部分需求,TPUv7已成为具备竞争力的“替代选项”。
为对抗行业竞争,英伟达正通过战略投资与算力扩容锁定供应链上下游,例如以芯片部署为前提战略投资OpenAI(300亿美元)与Anthropic(100亿美元)、为Meta旗下全新AI实验室MSL提供数百万块GPU算力支持,部分协议包含降价锁定客户需求的条款。
英伟达上季度交出超预期财报,但股价并未迎来上涨,核心原因在于2027年收入预期已充分反映,市场担心下游云厂商在资本开支强度达到50%以上后,进一步提升的空间极为有限。
理论上,作为云厂商供应链二级厂商的英伟达,若客户资本开支维持高位不再增长,来自云客户的收入可能陷入零增长,市场对 2027 年之后英伟达的长期成长预期趋于审慎,反映在当前对应 2027 年利润的市场定价上相对克制,也使得投资者的建仓意愿较为平淡。
从本次GTC大会内容来看,黄仁勋给出的“2027年数据中心累计收入达1万亿美元以上”,市场预期早已超越该水准。大会更多时间用于产品推销与路线规划,对产业链公司影响更为直接(如CPO与铜缆并用、LPU与HBM分担不同工作),但对英伟达自身而言,增量信息相对有限。
未来英伟达投资价值若要再度提升,长桥海豚君认为,除了AI应用需更大规模、更快速度落地外,还需要“物理AI”“太空算力”等新的“成长曲线”拉动。
作者长桥海豚研究,专注有灵魂的思考、有态度的研究。
文章仅属作者意见,不代表香港01立场。
01专栏精选不同范畴专家,丰富公共舆论场域,鼓励更多维度思考。