华为“凶猛”,黄仁勋没有退路

(图片来源:NVIDIA 官网)

就在全球 AI 龙头英伟达(NVIDIA)财报发布数小时前,华为再度隔空 " 硬碰硬 "。

5 月 29 日凌晨,华为技术团队在 Gitcode 平台上发布 Pangu Ultra MoE 万亿规模大模型技术报告,其拥有约 7180 亿参数规模的结构,首次全流程在昇腾 Ascend 910 上进行训练,显著提升推理吞吐并降低延迟,并且融合大算子和通信优化有效提升了 NPU 利用率,从而有效提高训练过程的稳健性。

而昨天,华为盘古还发布基于分组混合专家模型(MoGE)架构构建的盘古 Pro MoE 大模型,参数规模 720 亿,基于昇腾 300I Duo 和 800I A2 实现了更优专家负载分布与计算效率(321 tokens/s 和 1528 tokens/s)。

更早之前,华为技术团队称昇腾在 MoE 模型的推理部署性能已全面超越了基于英伟达 Hopper 架构的推理部署性能,而 DeepSeek 基于国产芯片的部署方案,性能也已超越英伟达 H100 系列芯片。另外,华为 "CloudMatrix 384 超节点 " 技术在算力规模和推理性能上也全面超越英伟达 NVL72。

因此,面对华为的 " 凶猛 " 进击 AI 算力赛道,身价 1173 亿美元的黄仁勋似乎也感受到全球 AI 市场的快速变化,并开始放缓新产品迭代速度,而转向网络架构。

5 月 29 日凌晨,英伟达发布 2026 财年第一季度(2025 自然年第二季度)业绩报告,收入利润仍在上涨。

财报显示,英伟达当季营收 441 亿美元,环比增长 12%,同比增长 69%;净利润 187.75 亿美元,市场预期 207.67 亿美元;调整后每股收益为 0.96 美元,市场预期 0.93 美元。其中,关键的数据中心业务营收同比增长 73%,达到 391 亿美元,略低于市场预期的 393 亿美元。

值得注意的是,财报中披露,4 月美国政府宣布 H20 对中国禁售,英伟达在 2026 财年第一季度因 H20 产品过剩库存和采购义务产生了 45 亿美元的费用,因为对 H20 产品的需求下降。在新的出口许可要求之前,2026 财年第一季度英伟达 H20 产品的销售额为 46 亿美元。英伟达在第一季度无法发货导致额外的 25 亿美元 H20 收入。此外,预计英伟达 Q2 受此损失 80 亿美元。

近期有消息称,英伟达即将在 6 月开始对华出货 B20" 特供版 " 芯片,以取代 H20。

谈到 B20 的进入对中国 AI 算力格局看法,Gartner 研究副总裁盛陵海(Roger Sheng)近期对笔者表示,AI 芯片到底是否适用、到底能不能受到欢迎,在于它能否支持最新 AI 大模型,且效率要高,从而要得到市场的认同,如果竞争力不高,可能没人去使用。然而,即便英伟达 AI 卡有更好的性能表现,同时也不放弃中国市场,但中国需要发展国产 AI 算力,一旦美国断供很难让企业信任。" 不能把所有的东西放在一个篮子里,我们要多元化(发展)。"

受财报影响,英伟达(NASDAQ:NVDA)股价盘后大涨 4.89%,最新市值 3.29 万亿美元。

数据中心收入持续暴涨,资本市场已不再 " 震惊 "

事实上,自 2025 年初 DeepSeek 热潮下,最受瞩目的就是英伟达。

华尔街质疑,DeepSeek" 现象级 " 的崛起,对美国科技巨头 3000 多亿美元的算力支出是否有用,动摇了推动美国 AI 行业发展预期。就在美股今年 1 月 27 日,英伟达股价暴跌 17%,收于 118.58 美元,市值蒸发近 6000 亿美元(约合 4.3 万亿元)。

CNBC 称,这是 " 美国公司有史以来的最大跌幅 "。

到了 5 月,华为又 " 助力 " 了。5 月中旬,华为发布 CloudMatrix 384 超节点技术,利用多宽带高速网络连接 AI 加速卡,用网络的 " 量 " 弥补显卡性能上的 " 质 ",以此算力训练更大规模的 AI 模型。

如今,英伟达已感受到了压力。

黄仁勋近期多次表示,中国 AI 竞争确实非常激烈,初创企业众多,大概有五十多家相关 GPU 算力公司迅速崛起,其中华为无疑是全球最具实力的科技公司之一。他提到华为昇腾 CloudMatrix 384 超节点和 910C,部分性能上甚至超过英伟达的产品。

" 这是一个我们必须高度重视、充分尊重的对手,我们也必须全力以赴,持续创新,才能在这样的竞争中保持领先地位。" 黄仁勋指出,华为目标就是将 5G 与 AI 深度融合,这一战略方向非常有前瞻性,也完全正确,而英伟达也在推进同样的工作。

财报显示,英伟达收入来源于数据中心、游戏、专业可视化、汽车等业务方向。

具体来看,数据中心业务上,英伟达当季营收为 391 亿美元,同比增长 73%,环比增长 10%。微软、谷歌等大型云服务平台仍然是英伟达最大的客户群体,占数据中心收入的近 50%。Blackwell 在该季度贡献了近 70% 的数据中心计算收入,Hopper 的迁移工作已接近完成。

其中,计算业务收入为 342 亿美元,同比增长 76%;网络收入为 50 亿美元,同比增长 56%。

英伟达 CFO 克雷斯(Colette Kress)表示,AI 工作负载已强势转向推理,AI 工厂的建设正在带来可观的收入,其对客户的承诺坚定不移。GB200 NVL 的引入是一项根本性的架构变革,旨在支持数据中心规模的工作负载,并实现最低的单位推理令牌成本。虽然这些系统的构建过程很复杂,但英伟达已经看到制造良率的显著提升,机架出货量也正在向最终客户稳步增长。

本季度,游戏方面营收 38 亿美元,同比增长 42%,环比增长 48%,增长主要得益于 Blackwell 架构 GPU 的销售;专业可视化业务营收 5.1 亿美元,同比增长 19%,环比持平;汽车业务营收为 5.8 亿美元,同比增长 72%,环比下降 1%。

黄仁勋表示:" 我们突破性的 Blackwell NVL72 AI 超级计算机——一款专为推理而设计的‘思考机器’——现已在系统制造商和云服务提供商中全面投入生产。全球对 NVIDIA AI 基础设施的需求异常强劲。AI 推理代币的产量在短短一年内就激增了十倍,随着 AI 代理成为主流,对 AI 计算的需求也将加速增长。世界各国都已将 AI 视为与电力和互联网一样重要的基础设施,而英伟达正处于这一深刻变革的中心。"

展望 2026 财年第二季度(2025 自然年三季度),英伟达指出,预计公司收入为 450 亿美元,上下浮动 2%。这一预期反映了近期出口管制限制导致的 H20 收入约 80 亿美元的损失;预计 GAAP 和非 GAAP 毛利率分别为 71.8% 和 72.0%,上下浮动 50 个基点,并力争在今年下半年将毛利率提高到 70% 左右;预计 GAAP 和非 GAAP 运营费用分别约为 57 亿美元和 40 亿美元。预计 2026 财年全年运营费用增长率将在 30% 左右。

对于英伟达来说,中国市场无疑是本季市场最为关注的事件。

黄仁勋近期表示,美国对华 AI 芯片出口管制是失败的。他说道," 事实证明,最初制定 AI 扩散规则的那些基本假设存在根本性缺陷。" 黄仁勋表示,英伟达在中国的市场份额已从美国前总统拜登执政初期的 95% 降至目前的 50%。

研究机构 Emarketer 分析师雅各布 · 伯恩(Jacob Bourne)在一份报告中表示,更广泛的担忧是,贸易紧张局势以及关税对数据中心扩张的潜在影响,可能会在未来几个季度对 AI 芯片的需求造成阻力。" 这并不意味着英伟达的主导地位将终结,但这凸显出,英伟达要维持这种主导地位,需要应对日益复杂的地缘政治、竞争和经济挑战。" 伯恩写道。

5 月 29 日财报会议上,黄仁勋表示,中国是全球最大的 AI 市场之一,也是通往全球成功的跳板。全球有一半的 AI 研究人员在中国,赢得中国市场的平台有望在全球领先。然而,如今价值 500 亿美元的中国市场实际上对美国企业关闭了大门。

"H20 出口禁令终止了我们在中国的 Hopper 数据中心业务。我们无法进一步削减 Hopper 的产能以遵守出口管制规定。因此,我们将对无法出售或重新利用的库存进行数十亿美元的减记。我们正在探索有限的竞争方式,但 Hopper 已不再是我们的选择。

无论有没有美国芯片,中国的 AI 都会不断发展。它必须进行计算才能训练和部署先进的模型。问题不在于中国是否会拥有 AI,它已经拥有了。问题在于,作为全球最大的 AI 市场之一,中国是否会在美国平台上运行。保护中国芯片制造商免受美国竞争的影响,只会增强它们在海外的竞争力,削弱美国的地位。出口限制刺激了中国的创新和规模化发展。

AI 竞赛不仅仅关乎芯片,而关乎世界将基于哪种技术栈运行。随着该技术栈扩展到 6G 和量子技术,美国的全球基础设施领导地位岌岌可危。

美国的政策建立在‘中国无法制造 AI 芯片’的假设之上。这一假设一直以来都备受质疑,现在显然是错误的。中国拥有巨大的制造能力。最终,赢得 AI 开发者的平台才能最终赢得 AI。出口管制应该强化美国的平台,而不是迫使全球一半的 AI 人才流向竞争对手。" 黄仁勋表示

克雷斯表示,虽然新加坡占英伟达第一季度账单收入的近 20%,因为许多大客户都使用新加坡进行集中开票,但英伟达的产品几乎总是运往其他地方。需要注意的是,H100、H200 和 Blackwell 数据中心计算收入中,超过 99% 的账单收入来自美国客户的订单。

谈到 DeepSeek,黄仁勋毫不吝啬地对 DeepSeek 和通义千问表达了赞赏,称其是 " 最佳开源 AI 模型之一 "。" 就像 ChatGPT 一样,引入了推理 AI,它思考的时间越长,给出的答案就越好。"

" 来自中国的 DeepSeek 和 Qwen 是最优秀的开源 AI 模型之一。它们免费发布,在美国、欧洲及其他地区都获得了广泛关注。DeepSeek-R1 与 ChatGPT 类似,引入了推理 AI,其思考时间越长,给出的答案就越好。推理 AI 能够逐步解决问题、规划和使用工具,将模型转化为智能代理。推理是计算密集型的,每个任务需要的令牌数量是以前一次性推理的数千倍——每个任务需要的令牌数量是以前的一次性推理的数千倍。推理模型正在推动推理需求的阶跃式增长。AI Scaling Law 保持不变,不仅在训练方面,现在推理也需要大规模计算。" 黄仁勋称。

克雷斯表示,英伟达在制造良率方面得到显著改善,机架出货量正以强劲速度交付。GB300 也预计本季度末量产发货。

" 我们的目标是在一年内在美国制造从芯片到超级计算机的整个过程。每个 GB200 NVLink72 机架包含 120 万个组件,重近 2 吨。迄今为止,还没有人生产过如此规模的超级计算机,我们的合作伙伴正在作出非凡的贡献。" 黄仁勋称。

黄仁勋强调," 美国将永远是英伟达最大的市场,也是我们基础设施最大安装基数的所在地。如今,每个国家都将 AI 视为下一次工业革命的核心,这是一个为每个经济体提供智能和必要基础设施的新兴产业。各国正在竞相构建国家级 AI 平台,以提升其数字化能力。上周,我前往瑞典,出席了该国首个国家级 AI 基础设施的启动仪式。日本、韩国、印度、加拿大、法国、英国、德国、意大利、西班牙等国家正在建设 AI 工厂,以赋能初创企业、各行各业和社会。自主 AI 是英伟达新的增长引擎。"

华为完成中国 AI 大模型推理适配部署,H20 作用大大减少

黄仁勋对华为中国 AI 市场的渴求,已经摆在了台面上。

"DeepSeek 凸显了开源 AI 的战略价值。当热门模型在美国平台上进行训练和优化时,它将推动其应用、反馈和持续改进,从而巩固美国在整个 AI 领域的领导地位。美国平台必须继续成为开源 AI 的首选平台。这意味着要支持与包括中国在内的全球顶尖开发者的合作,当像 DeepSeek 和阿里 Qwen 这样的模型在美国基础设施上达到最佳运行状态时,美国就将获得胜利。" 黄仁勋认为中国 AI 大模型应该要用英伟达这样的美国 AI 系统进行训练,而不应该是华为。

实际上,2017 年美国开始发动对华贸易战,2018 年已经开始在半导体和芯片等领域围堵中国,2019 年切断了对华为 5G 芯片的供应。

过去六年,华为 " 低调 " 处理,接连完成消费级、云服务器层面的芯片部署。当前,基于高达 100% 国产化率的昇腾芯片,华为昇腾鲲鹏 AI 系统已经解决了大模型训练、推理问题。所以这对于黄仁勋来说,无疑是一个巨大打击。

就在 5 月 29 日一场学术活动上披露,DeepSeek 模型已经在华为昇腾上进行了高效推理。通过对模型算子权重进行 Int4 量化优化,显著降低现存占用,首次实现单台华为 8 卡服务器上的 DeepDeek-R1 的推理,同时在 DeepSeek V2 推理性能比 vLLM 昇腾版本在不同请求下平均提升 88% 以上。

上述是一套自主可控的推理优化方案。

据 Gartner 最新报告显示,截至目前,消费者业务全球份额高达 21%,国产芯片自给率高达 42%,模拟芯片、无线通讯相关产业芯片达到 27% 的自给率。

盛陵海对笔者指出,随着自研芯片趋势,自给率份额会逐渐提升。比如,预期今年由于 AI 市场的投资持续增加,国产 AI 芯片自给率会有进一步提升。中国芯片企业把眼光不应该仅局限于国产替代,而且要建立相关标准、要去国际市场做新的竞争。

不过,目前国产 AI 芯片依然存在很多不足。

中国科学院院士、清华大学计算机系教授胡事民表示,国产芯片格局已基本明朗,高端芯片与美国仍有较大差距。算法和模型优化能够实现卓越的性能提升,弥补国产算力不足,原始创新仍然需要加强。

近期华为发布的 CloudMatrix 384 超节点,通过全面架构创新,在算力、互联带宽、内存带宽等方面实现全面领先。而目前,华为开发者规模超 1200 万,伙伴数量超 4.5 万,云商店应用数量超 1.2 万。

目前,黄仁勋也在追赶华为 384 超节点,部署多个网络平台。他在财报会上表示,目前英伟达有四个网络扩展平台:NVLink、InfiniBand、Spectrum-X 和 BlueField。

黄仁勋也透露了公司对全球 AI 基础设施建设的宏伟愿景:" 我们可以预见到在不远的将来,需要数十吉瓦的英伟达 AI 基础设施的项目。"

他指出,AI 是一种基础设施。就像电力和互联网成为基础设施一样,AI 将成为每个国家、每个行业必不可少的基础设施。我们正处于这种基础设施建设的初期阶段。

展望未来,英伟达仍保持乐观。黄仁勋强调," 这是强劲新一波增长的开始。Grace Blackwell 已全面投产,我们已全力以赴。我们现在有多个重要的增长引擎。"

"AI 时代已经到来,从 AI 基础设施、大规模推理、自主 AI、企业 AI 和工业 AI,NVIDIA 已经做好准备。" 黄仁勋称。(本文首发于钛媒体 App,作者|林志佳)