华为“凶猛”，黄仁勋没有退路

（图片来源：NVIDIA 官网）

就在全球 AI 龙头英伟达（NVIDIA）财报发布数小时前，华为再度隔空 " 硬碰硬 "。

5 月 29 日凌晨，华为技术团队在 Gitcode 平台上发布 Pangu Ultra MoE 万亿规模大模型技术报告，其拥有约 7180 亿参数规模的结构，首次全流程在昇腾 Ascend 910 上进行训练，显著提升推理吞吐并降低延迟，并且融合大算子和通信优化有效提升了 NPU 利用率，从而有效提高训练过程的稳健性。

而昨天，华为盘古还发布基于分组混合专家模型（MoGE）架构构建的盘古 Pro MoE 大模型，参数规模 720 亿，基于昇腾 300I Duo 和 800I A2 实现了更优专家负载分布与计算效率（321 tokens/s 和 1528 tokens/s）。

更早之前，华为技术团队称昇腾在 MoE 模型的推理部署性能已全面超越了基于英伟达 Hopper 架构的推理部署性能，而 DeepSeek 基于国产芯片的部署方案，性能也已超越英伟达 H100 系列芯片。另外，华为 "CloudMatrix 384 超节点 " 技术在算力规模和推理性能上也全面超越英伟达 NVL72。

因此，面对华为的 " 凶猛 " 进击 AI 算力赛道，身价 1173 亿美元的黄仁勋似乎也感受到全球 AI 市场的快速变化，并开始放缓新产品迭代速度，而转向网络架构。

5 月 29 日凌晨，英伟达发布 2026 财年第一季度（2025 自然年第二季度）业绩报告，收入利润仍在上涨。

财报显示，英伟达当季营收 441 亿美元，环比增长 12%，同比增长 69%；净利润 187.75 亿美元，市场预期 207.67 亿美元；调整后每股收益为 0.96 美元，市场预期 0.93 美元。其中，关键的数据中心业务营收同比增长 73%，达到 391 亿美元，略低于市场预期的 393 亿美元。

值得注意的是，财报中披露，4 月美国政府宣布 H20 对中国禁售，英伟达在 2026 财年第一季度因 H20 产品过剩库存和采购义务产生了 45 亿美元的费用，因为对 H20 产品的需求下降。在新的出口许可要求之前，2026 财年第一季度英伟达 H20 产品的销售额为 46 亿美元。英伟达在第一季度无法发货导致额外的 25 亿美元 H20 收入。此外，预计英伟达 Q2 受此损失 80 亿美元。

近期有消息称，英伟达即将在 6 月开始对华出货 B20" 特供版 " 芯片，以取代 H20。

谈到 B20 的进入对中国 AI 算力格局看法，Gartner 研究副总裁盛陵海（Roger Sheng）近期对笔者表示，AI 芯片到底是否适用、到底能不能受到欢迎，在于它能否支持最新 AI 大模型，且效率要高，从而要得到市场的认同，如果竞争力不高，可能没人去使用。然而，即便英伟达 AI 卡有更好的性能表现，同时也不放弃中国市场，但中国需要发展国产 AI 算力，一旦美国断供很难让企业信任。" 不能把所有的东西放在一个篮子里，我们要多元化（发展）。"

受财报影响，英伟达（NASDAQ：NVDA）股价盘后大涨 4.89%，最新市值 3.29 万亿美元。

数据中心收入持续暴涨，资本市场已不再 " 震惊 "

事实上，自 2025 年初 DeepSeek 热潮下，最受瞩目的就是英伟达。

华尔街质疑，DeepSeek" 现象级 " 的崛起，对美国科技巨头 3000 多亿美元的算力支出是否有用，动摇了推动美国 AI 行业发展预期。就在美股今年 1 月 27 日，英伟达股价暴跌 17%，收于 118.58 美元，市值蒸发近 6000 亿美元（约合 4.3 万亿元）。

CNBC 称，这是 " 美国公司有史以来的最大跌幅 "。

到了 5 月，华为又 " 助力 " 了。5 月中旬，华为发布 CloudMatrix 384 超节点技术，利用多宽带高速网络连接 AI 加速卡，用网络的 " 量 " 弥补显卡性能上的 " 质 "，以此算力训练更大规模的 AI 模型。

如今，英伟达已感受到了压力。

黄仁勋近期多次表示，中国 AI 竞争确实非常激烈，初创企业众多，大概有五十多家相关 GPU 算力公司迅速崛起，其中华为无疑是全球最具实力的科技公司之一。他提到华为昇腾 CloudMatrix 384 超节点和 910C，部分性能上甚至超过英伟达的产品。

" 这是一个我们必须高度重视、充分尊重的对手，我们也必须全力以赴，持续创新，才能在这样的竞争中保持领先地位。" 黄仁勋指出，华为目标就是将 5G 与 AI 深度融合，这一战略方向非常有前瞻性，也完全正确，而英伟达也在推进同样的工作。

财报显示，英伟达收入来源于数据中心、游戏、专业可视化、汽车等业务方向。

具体来看，数据中心业务上，英伟达当季营收为 391 亿美元，同比增长 73%，环比增长 10%。微软、谷歌等大型云服务平台仍然是英伟达最大的客户群体，占数据中心收入的近 50%。Blackwell 在该季度贡献了近 70% 的数据中心计算收入，Hopper 的迁移工作已接近完成。

其中，计算业务收入为 342 亿美元，同比增长 76%；网络收入为 50 亿美元，同比增长 56%。

英伟达 CFO 克雷斯（Colette Kress）表示，AI 工作负载已强势转向推理，AI 工厂的建设正在带来可观的收入，其对客户的承诺坚定不移。GB200 NVL 的引入是一项根本性的架构变革，旨在支持数据中心规模的工作负载，并实现最低的单位推理令牌成本。虽然这些系统的构建过程很复杂，但英伟达已经看到制造良率的显著提升，机架出货量也正在向最终客户稳步增长。

本季度，游戏方面营收 38 亿美元，同比增长 42%，环比增长 48%，增长主要得益于 Blackwell 架构 GPU 的销售；专业可视化业务营收 5.1 亿美元，同比增长 19%，环比持平；汽车业务营收为 5.8 亿美元，同比增长 72%，环比下降 1%。

黄仁勋表示：" 我们突破性的 Blackwell NVL72 AI 超级计算机——一款专为推理而设计的‘思考机器’——现已在系统制造商和云服务提供商中全面投入生产。全球对 NVIDIA AI 基础设施的需求异常强劲。AI 推理代币的产量在短短一年内就激增了十倍，随着 AI 代理成为主流，对 AI 计算的需求也将加速增长。世界各国都已将 AI 视为与电力和互联网一样重要的基础设施，而英伟达正处于这一深刻变革的中心。"

展望 2026 财年第二季度（2025 自然年三季度），英伟达指出，预计公司收入为 450 亿美元，上下浮动 2%。这一预期反映了近期出口管制限制导致的 H20 收入约 80 亿美元的损失；预计 GAAP 和非 GAAP 毛利率分别为 71.8% 和 72.0%，上下浮动 50 个基点，并力争在今年下半年将毛利率提高到 70% 左右；预计 GAAP 和非 GAAP 运营费用分别约为 57 亿美元和 40 亿美元。预计 2026 财年全年运营费用增长率将在 30% 左右。

对于英伟达来说，中国市场无疑是本季市场最为关注的事件。

黄仁勋近期表示，美国对华 AI 芯片出口管制是失败的。他说道，" 事实证明，最初制定 AI 扩散规则的那些基本假设存在根本性缺陷。" 黄仁勋表示，英伟达在中国的市场份额已从美国前总统拜登执政初期的 95% 降至目前的 50%。

研究机构 Emarketer 分析师雅各布 · 伯恩（Jacob Bourne）在一份报告中表示，更广泛的担忧是，贸易紧张局势以及关税对数据中心扩张的潜在影响，可能会在未来几个季度对 AI 芯片的需求造成阻力。" 这并不意味着英伟达的主导地位将终结，但这凸显出，英伟达要维持这种主导地位，需要应对日益复杂的地缘政治、竞争和经济挑战。" 伯恩写道。

5 月 29 日财报会议上，黄仁勋表示，中国是全球最大的 AI 市场之一，也是通往全球成功的跳板。全球有一半的 AI 研究人员在中国，赢得中国市场的平台有望在全球领先。然而，如今价值 500 亿美元的中国市场实际上对美国企业关闭了大门。

"H20 出口禁令终止了我们在中国的 Hopper 数据中心业务。我们无法进一步削减 Hopper 的产能以遵守出口管制规定。因此，我们将对无法出售或重新利用的库存进行数十亿美元的减记。我们正在探索有限的竞争方式，但 Hopper 已不再是我们的选择。

无论有没有美国芯片，中国的 AI 都会不断发展。它必须进行计算才能训练和部署先进的模型。问题不在于中国是否会拥有 AI，它已经拥有了。问题在于，作为全球最大的 AI 市场之一，中国是否会在美国平台上运行。保护中国芯片制造商免受美国竞争的影响，只会增强它们在海外的竞争力，削弱美国的地位。出口限制刺激了中国的创新和规模化发展。

AI 竞赛不仅仅关乎芯片，而关乎世界将基于哪种技术栈运行。随着该技术栈扩展到 6G 和量子技术，美国的全球基础设施领导地位岌岌可危。

美国的政策建立在‘中国无法制造 AI 芯片’的假设之上。这一假设一直以来都备受质疑，现在显然是错误的。中国拥有巨大的制造能力。最终，赢得 AI 开发者的平台才能最终赢得 AI。出口管制应该强化美国的平台，而不是迫使全球一半的 AI 人才流向竞争对手。" 黄仁勋表示

克雷斯表示，虽然新加坡占英伟达第一季度账单收入的近 20%，因为许多大客户都使用新加坡进行集中开票，但英伟达的产品几乎总是运往其他地方。需要注意的是，H100、H200 和 Blackwell 数据中心计算收入中，超过 99% 的账单收入来自美国客户的订单。

谈到 DeepSeek，黄仁勋毫不吝啬地对 DeepSeek 和通义千问表达了赞赏，称其是 " 最佳开源 AI 模型之一 "。" 就像 ChatGPT 一样，引入了推理 AI，它思考的时间越长，给出的答案就越好。"

" 来自中国的 DeepSeek 和 Qwen 是最优秀的开源 AI 模型之一。它们免费发布，在美国、欧洲及其他地区都获得了广泛关注。DeepSeek-R1 与 ChatGPT 类似，引入了推理 AI，其思考时间越长，给出的答案就越好。推理 AI 能够逐步解决问题、规划和使用工具，将模型转化为智能代理。推理是计算密集型的，每个任务需要的令牌数量是以前一次性推理的数千倍——每个任务需要的令牌数量是以前的一次性推理的数千倍。推理模型正在推动推理需求的阶跃式增长。AI Scaling Law 保持不变，不仅在训练方面，现在推理也需要大规模计算。" 黄仁勋称。

克雷斯表示，英伟达在制造良率方面得到显著改善，机架出货量正以强劲速度交付。GB300 也预计本季度末量产发货。

" 我们的目标是在一年内在美国制造从芯片到超级计算机的整个过程。每个 GB200 NVLink72 机架包含 120 万个组件，重近 2 吨。迄今为止，还没有人生产过如此规模的超级计算机，我们的合作伙伴正在作出非凡的贡献。" 黄仁勋称。

黄仁勋强调，" 美国将永远是英伟达最大的市场，也是我们基础设施最大安装基数的所在地。如今，每个国家都将 AI 视为下一次工业革命的核心，这是一个为每个经济体提供智能和必要基础设施的新兴产业。各国正在竞相构建国家级 AI 平台，以提升其数字化能力。上周，我前往瑞典，出席了该国首个国家级 AI 基础设施的启动仪式。日本、韩国、印度、加拿大、法国、英国、德国、意大利、西班牙等国家正在建设 AI 工厂，以赋能初创企业、各行各业和社会。自主 AI 是英伟达新的增长引擎。"

华为完成中国 AI 大模型推理适配部署，H20 作用大大减少

黄仁勋对华为中国 AI 市场的渴求，已经摆在了台面上。

"DeepSeek 凸显了开源 AI 的战略价值。当热门模型在美国平台上进行训练和优化时，它将推动其应用、反馈和持续改进，从而巩固美国在整个 AI 领域的领导地位。美国平台必须继续成为开源 AI 的首选平台。这意味着要支持与包括中国在内的全球顶尖开发者的合作，当像 DeepSeek 和阿里 Qwen 这样的模型在美国基础设施上达到最佳运行状态时，美国就将获得胜利。" 黄仁勋认为中国 AI 大模型应该要用英伟达这样的美国 AI 系统进行训练，而不应该是华为。

实际上，2017 年美国开始发动对华贸易战，2018 年已经开始在半导体和芯片等领域围堵中国，2019 年切断了对华为 5G 芯片的供应。

过去六年，华为 " 低调 " 处理，接连完成消费级、云服务器层面的芯片部署。当前，基于高达 100% 国产化率的昇腾芯片，华为昇腾鲲鹏 AI 系统已经解决了大模型训练、推理问题。所以这对于黄仁勋来说，无疑是一个巨大打击。

就在 5 月 29 日一场学术活动上披露，DeepSeek 模型已经在华为昇腾上进行了高效推理。通过对模型算子权重进行 Int4 量化优化，显著降低现存占用，首次实现单台华为 8 卡服务器上的 DeepDeek-R1 的推理，同时在 DeepSeek V2 推理性能比 vLLM 昇腾版本在不同请求下平均提升 88% 以上。

上述是一套自主可控的推理优化方案。

据 Gartner 最新报告显示，截至目前，消费者业务全球份额高达 21%，国产芯片自给率高达 42%，模拟芯片、无线通讯相关产业芯片达到 27% 的自给率。

盛陵海对笔者指出，随着自研芯片趋势，自给率份额会逐渐提升。比如，预期今年由于 AI 市场的投资持续增加，国产 AI 芯片自给率会有进一步提升。中国芯片企业把眼光不应该仅局限于国产替代，而且要建立相关标准、要去国际市场做新的竞争。

不过，目前国产 AI 芯片依然存在很多不足。

中国科学院院士、清华大学计算机系教授胡事民表示，国产芯片格局已基本明朗，高端芯片与美国仍有较大差距。算法和模型优化能够实现卓越的性能提升，弥补国产算力不足，原始创新仍然需要加强。

近期华为发布的 CloudMatrix 384 超节点，通过全面架构创新，在算力、互联带宽、内存带宽等方面实现全面领先。而目前，华为开发者规模超 1200 万，伙伴数量超 4.5 万，云商店应用数量超 1.2 万。

目前，黄仁勋也在追赶华为 384 超节点，部署多个网络平台。他在财报会上表示，目前英伟达有四个网络扩展平台：NVLink、InfiniBand、Spectrum-X 和 BlueField。

黄仁勋也透露了公司对全球 AI 基础设施建设的宏伟愿景：" 我们可以预见到在不远的将来，需要数十吉瓦的英伟达 AI 基础设施的项目。"

他指出，AI 是一种基础设施。就像电力和互联网成为基础设施一样，AI 将成为每个国家、每个行业必不可少的基础设施。我们正处于这种基础设施建设的初期阶段。

展望未来，英伟达仍保持乐观。黄仁勋强调，" 这是强劲新一波增长的开始。Grace Blackwell 已全面投产，我们已全力以赴。我们现在有多个重要的增长引擎。"

"AI 时代已经到来，从 AI 基础设施、大规模推理、自主 AI、企业 AI 和工业 AI，NVIDIA 已经做好准备。" 黄仁勋称。（本文首发于钛媒体 App，作者｜林志佳）