“新五强”争锋,基础大模型玩家再洗牌

文|光锥智能,作者 | 魏琳华  ,编辑|王一粟

大模型公司正在进行新一轮的排位赛。

AI 应用如火如荼,但在 " 看不见 " 的水面之下,基础大模型的战争仍在继续。不像预期般放缓脚步,而是变得更 " 卷 " 了:

据光锥智能不完全统计,2025 年开始至今,中国参与模型竞争的百度、字节、阿里、DeepSeek 和 " 六小虎 " 等主要大模型公司,发布了超过 45 款基础大模型(不包括行业垂类大模型),相当于每 3.3 天,就有一款新的模型发布。

而在上半年,国内大模型公司的第一梯队,正在无限接近海外第一梯队的格局。

对比三家大厂 + 两家创业公司组合成海外 " 五强 " 的 OpenAI、Google、Anthropic、X.AI 和 Meta,国内大模型团队也在分化成由阿里、字节、DeepSeek、阶跃星辰和智谱的 "3+2" 组合,成为国内的 " 新基模五强 "。

神仙打架," 新基建五强 " 半年发 30 个大模型

上半年,基础大模型领域仍然是 " 神仙打架 " 的局面。

以国内 " 基模五强 " 公司上半年发布的模型数量统计来看,五家公司共发布 32 个大模型。从发布数量上来看,阿里和阶跃星辰是突出的两个 " 卷王 ",其中阶跃星辰发布 11 款模型,阿里发布 9 款模型,加起来超过五家公司的半数。

结合大模型行业发展趋势,开源、推理和多模态,成为三个关键词:

从时间线来看,五家公司中,阿里、智谱和 DeepSeek 三家早就坚定走开源路线。

其中,阿里是独一无二的 " 开源卷王 ",自 2023 年起,阿里就将旗下多款模型发布在开源社区。无论从开源数量还是类型来说,阿里都是最全面的一家。

这也让阿里成为了当下多个领域的开源 SOTA 提供者。4 月 29 日上线的混合推理模型 Qwen3 成为目前全球最强的开源模型,而其成本仅为 DeepSeek-R1 的 35%。

当然,在 Qwen3 之前,国内上一个掀起推理模型热的公司,就是 " 鲶鱼 "DeepSeek。

对比上述四家公司,DeepSeek 是唯一一家 " 专才 ",不做大模型矩阵。比如春节期间发布的推理大模型 DeepSeek R1,性能拉满的同时做到了极低成本,训练只要 GPT-4o 的 1/10,输入成本更是低至 2%,一举出圈,成为后续推理大模型的 " 标杆 "。

多模态大模型,则是今年大模型公司的研发重点方向。

比如,被称为 " 多模态卷王 " 的阶跃星辰,目前共发布 22 个基础模型,其中多模态领域的大模型高达 16 个。

其中,阶跃星辰联合吉利开源文生视频大模型 Step-Video-T2V,成为当时全球范围内参数量最大、性能最好的开源视频生成大模型,Step-Audio 则是行业内首个产品级的开源语音交互模型。

布局全面的字节今年在多模态领域表现也开始加入第一梯队。以文生图模型 Seedream 3.0 来说,除了提升画质和生成效率之外,它还提升了 AI 生图在商业化领域的应用能力。由此,其对应产品即梦 AI 的文生图效果一度出圈。

不过,相比大语言模型,行业内多模态大模型的发展程度还远远不够。用姜大昕的话来说," 多模态模型领域,目前还没有出现 GPT-4 时刻。"

在姜大昕看来,它的卡点就在于整个行业缺少多模态领域的理解生成一体化架构。大语言模型已经做到了,但多模态大模型的理解和生成仍然由不同的模型完成。对于计算机视觉来说,这是一个几十年没有解决的顽固问题。

对比大语言模型的 ChatGPT 和推理模型 DeepSeek-R1,多模态领域仍有机会等到下一个爆款模型。

走向 AGI,什么是必经之路?

在 AI 应用落地如火如荼、Scaling Law 边际效益递减的今天,继续押注基础大模型还有价值吗?

100 天之前,DeepSeek 的发布无疑给行业了一个无比确定的答案。

" 一切变化都太快了,每天早上起来,新模型、新产品的发布都可能颠覆掉过往的认知。" 一位创业者向光锥智能感慨道。

正如我们上面提到,这半年,模型发布的速度不减反增。同时,由模型能力提升带来的技术红利让 DeepSeek 们站到台前,而没有技术优势的公司则在投资热情退潮时,失去了继续立在第一梯队的机会。

为了更长久地留在牌桌上,无论是大厂还是创业公司,抢钱、抢人才,依旧是 2025 年的主旋律。

如今,算力、人才和资金仍然是衡量大模型公司立在牌桌上的三个硬指标。对大厂来说,资金自然不成问题,但对于创业公司来说,必须拉到足够的投资来为公司前期的研发买单。

以资金作为衡量指标,大厂自然相对充沛,但是初创阵营中只有 " 北京队 " 智谱和 " 上海队 " 阶跃星辰这两家被国资看好的企业,可以在大模型公司的寒冬期持续获得资本青睐。

以智谱来说,它在三月接连拿下杭州、珠海和成都三家国资的投资,累计共达到 18 亿人民币;去年 12 月,阶跃星辰拿到数亿美元资金,完成 B 轮融资。

再从人才衡量,目前 " 基模五强 " 正在展现对人才的虹吸效应。以字节来说,从 2023-2025 年,这家公司挖走了海内外的多位研发骨干,比如曾任谷歌 DeepMind 研究副总裁的吴永辉,今年加入字节成为大模型团队 Seed 的基础研究负责人。

在大量堆积资金和人才的基础上,上述基模五强逐渐建立了优势:" 开源卷王 " 阿里用生态拉拢 B 端用户,字节则一边补齐基础模型的版图,一边靠豆包、扣子等应用反哺模型升级,DeepSeek 靠性能和低价成为性价比之王,智谱的大模型落地在政企端优势明显,阶跃则成了 " 多模态卷王 ",发出多款 SOTA 模型。

上述企业的目标都是继续提升大模型的 " 智能上限 ",用溢出的模型能力支撑 AI 应用的能力突破。

以智能体(Agent)来说,其关键能力在于多模态、慢思考以及记忆能力。

有了多模态理解能力,才能让以大模型为技术底座的 Agent 能够 " 阅读 " 并理解手机和电脑屏幕中的信息,从而让 AI 也能够代替人类操作智能终端;而推理能力则让 AI 能够根据用户需求拆解任务,按照每一个规划好的步骤推进,最终完成任务。

Google DeepMind CEODemis Hassabis 认为,目前通往 AGI 的道路已经开始变得清晰,但要真正抵达这个目标,仍需要突破多个技术瓶颈,整合多项关键能力。

在有限的时间内,谁的硬指标更全面、基座模型能力更强,谁才能有机会真正获得 AGI 的入场券。

大模型商业化趋势:开源、垂类场景落地

商业化是基础大模型公司不能跳过去的命题,其商业化的策略,往往和技术的战略也一脉相承。

2025 年,开源和垂类场景应用成为模型商业化的两个关键方向。

先来说开源,开源的中国大模型已经在全球占据了半壁江山。目前,在开源社区 HuggingFace 上,前 30 的热门模型,已经有 12 个模型来自于中国公司,其中出现了阶跃星辰最新的音乐模型 ACE-Step、DeepSeek 的 R1 和 Prover-v2、阿里的 Qwen3 系列、字节 Seed 的小参数代码模型和腾讯混元的 AI 视频模型。

开源之后,大模型公司可以尝试的商业化手段变得更加多样:国内以 DeepSeek 和阿里作为代表,采用的是更加开放的协议,这种模型一般可以走三种模式,最直观的是调用 API 付费,云厂商则通过提供 GPU 服务收 " 水电费 ",另外,围绕开源模型的定制化调整和技术服务也是一种模式。

不过,真正能直接使用开源模型的企业和个人都是少数,多数人更需要一个 " 开箱即用 " 的完整产品。所以,AI 在垂类场景的应用越来越火热。

最火热的无疑就是各行各业的智能体(Agent),从政企、金融到医疗,智能体可谓无处不在。但目前热度更高的,还是智能体和智能终端的结合。

为什么智能体 + 智能终端成为了关键的落地方向?

" 汽车不仅具有高价值的软硬件系统,还与用户有着密切的联系,这使其成为理想的 AI 载体。" 长城汽车 CTO 吴会肖说。同样,这条规则也适用于手机、具身智能等产品。

而对于厂商来说,和多模态、强化学习能力等相同,做 Agent,同样也是大模型企业通向 AGI 之路的基石之一。在 OpenAI 给出的 AGI 五阶段来说,Agent 对应的就是 L3 阶段,即 AI 拥有自主操作能力,在 L3 的基础上,AI 才能进一步追求自主学习的能力。

所以,对于大模型公司来说,做 Agent 的商业化战略就是在技术基础上延伸而来的一步棋。

阶跃星辰和智谱,这两家大模型的南北双雄,也不约而同地都瞄准了智能终端赛道。

智谱在去年就推出了能够在手机端运行的智能体 AutoGLM,让 Agent 接管各种应用调配,实现用户需求。

而在今年,阶跃星辰进一步扩大了 Agent 在智能终端的落地范围,在 2 月份的开放日上,这家公司放出了 Agent 在汽车、手机、具身智能、IoT 四个领域的应用。

如今,各家大模型公司都在抢夺智能终端客户的订单。以阶跃星辰来说,在今年拿到了和 OPPO、千里科技、吉利汽车集团、智元机器人等厂商的合作。

Agent 能力的叠加,也在成为智能终端产品的卖点。比如,搭载了 " 一键全能搜 "、" 一键问屏 " 的 OPPO 手机 Find N5 和 Find X8 销量亮眼。据悉,其中 Find X8 成为 Find 系列史上同期销量最高的产品。

比起其他业务来说,智能体 + 智能终端的合作,也为企业带来了可观的收入。据《智能涌现》报道,随着三星等大单的签订,智谱节后不到一个月,收入已经过亿。

从这一代 AI 大模型公司的商业化来看,大家都在避免传统 ToB 赛道重复造轮子的私有化定制,希望借助技术的红利,把产品尽量做得标准化,以此来实现更高的毛利率。

无论是提供开源工具的 " 自助火锅店 ",还是垂类智能体的 " 私房菜餐厅 ",大模型商业化的前景都在变得越来越乐观。