智谱AI发布2025年度财报：营收增长迅猛，Token价值飙升，力追Anthropic

ai-front · 2026 年4 月 1 日 14:54

智谱AI财报：营收增长但亏损扩大，Token价值受重视，未来押注国产芯片和Agent生态。

原文标题：智谱AI财报炸场，Token价值暴涨、核心指标直追Anthropic水平！CEO张鹏：人人都将是“Token架构师”

原文作者：AI前线

原文链接： http://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==&mid=2247660189&idx=1&sn=872ca2faa208b23d64e1eafb2d720b33&

冷月清谈：

智谱AI发布2025年度财报，营收7.24亿元，同比增长131.9%，但年内亏损扩大至47.18亿元。本地化部署服务是主要收入来源，但云端部署服务毛利率提升明显。智谱强调Token消耗规模的重要性，并提出“Token架构力”的概念，对标Anthropic，API平台ARR增长迅速。未来，智谱将加大国产芯片投入，并认为大模型将重塑计算平台，从App堆叠走向API商店与Agent矩阵协同。

怜星夜思：

1、智谱AI财报中提到“Token 架构力”的概念，这会对未来的AI应用开发产生什么影响？普通开发者应该如何准备以适应这种变化？
2、财报显示智谱AI在国产芯片适配上投入很多，这对于中国AI产业的发展意味着什么？你觉得国产芯片在AI领域的突破口在哪里？
3、智谱AI认为未来计算平台将从App堆叠走向API商店与Agent矩阵协同，你认同这个观点吗？如果是这样，对于用户来说，使用习惯会发生哪些变化？

原文内容

整理｜华卫

昨日，智谱交出了 2025 年度业绩报告，这是其上市近三个月后的首份年度财报。今年 1 月 8 日，智谱登陆港交所，股价从发行价 116.2 港元一度冲至近 700 港元，目前市值超 3000 亿港元。

这份业绩报告喜忧参半，其收入激增但亦被分析师评增长低于预期，且综合毛利率不佳。智谱表示，公司预计通过收入增长和提升运营效率实现盈利，但尚未给出具体时间表。智谱还在财报中传达了一个信号，将继续加大投资，增加国产芯片在训练模型中的使用。

营收翻倍增长，亏损同比扩大

财报显示，智谱 2025 年营收 7.24 亿元，同比增长 131.9%；毛利 2.97 亿元，同比增长 68.7%；毛利率为 41.0%，较上年的 56.3% 下降 15.3 个百分点；年内亏损 47.18 亿元，同比扩大 59.5%；经调整后净亏损 31.82 亿元，同比扩大 29.1%；研发投入 31.8 亿元，同比增长 44.9%。

从营收情况来看，智谱是一家典型的大模型公司：收入增长很快，但亏损巨大；研发投入仍然非常重，强度达营收的 4.4 倍。此外，智谱的毛利率下降明显，整体综合毛利率由 2024 年的 56.3% 降至 41.0%。

收入结构上，智谱 2025 年以本地化部署服务为主。其中，本地化部署服务收入 5.34 亿元，同比增长 102.3%，占总收入的 73.7%；云端部署服务收入 1.90 亿元，同比增长 292.6%，占比 26.3%。需要注意的是，2025 年智谱这两种服务模式的毛利率变化不一。云端部署毛利率从上年的 3.3% 提升到 18.9%，改善不小；但本地化部署毛利率则从 66.0% 下降到 48.8%。

财报中对此的解释是，云端部署业务主要由于模型推理效率提升、算力规模扩张导致边际成本递减，同时价格有所增加；即通过对推理侧的极致工程优化，在大幅度降低单位成本的同时，实现了毛利表现的稳健提升；本地化部署业务由于为满足客户需求而投入了更多的交付资源。

具体按业务形态与核心产品线来拆分，智谱 2025 年的企业级通用大模型收入 3.66 亿元，占比 50.4%；开放平台及 API 收入 1.90 亿元，占比 26.3%；企业级智能体收入 1.66 亿元，占比 22.9%；技术服务及其他收入占比低。

值得一提的是，智谱所有业务收入相较 2024 年均同比增长。其中，企业级通用大模型收入增幅达 70.5%，开放平台及 API 的收入增幅达 292.6%，企业级智能体收入增幅达 248.8%，技术服务及其他收入增幅达 31.6%。

Token 价值大增，

核心指标直追 Anthropic 水平

“‘智能上界的突破’是这个时代唯一的物理第一性。如果说智能上界决定了技术的定价权，那么 Token 的消耗规模则决定了商业价值的体量。”智谱在财报中称，其内部推导出了一个简洁的公式： AGI 商业价值 = 智能上界×Token 消耗规模。2025 年，随着 GLM 在编程 (Coding) 与智能体 (Agent) 等元场景的深度渗透，智谱付费 Token 消耗量实现了指数级跃迁。凭借 GLM 系列，智谱实现了从开发者生态到全球化 MaaS (Model-as-a-Service) 平台的全面爆发。

据了解，在稍晚的智谱年度业绩发布电话会上，智谱 CEO 张鹏进一步提出了“Token 架构力”（Token Architect）新概念，将 AI 生产力价值定义为“智能调用量 × 智能质量 × 经济转化效率”。并且，张鹏表示，“当模型足够强，API 本身就是最好的商业模式。”

在业务模式上，智谱一直对标 Anthropic。Anthropic 的 CEO Dario Amodei 曾透露，公司 60% 至 75% 的收入来自 API，且明确将编程作为核心用例，因为"企业用例为模型改进提供了更强的激励"。智谱此次发布的财报中，表演最亮眼的也来自 API 平台。

财报显示，截至报告期末，智谱 API 平台 ARR 实现 17 亿元，过去一年提升 60 倍。2025 年推出的 GLM Coding Plan，付费开发者规模突破 24.2 万。GLM-5 发布后 24 小时内即获得字节、阿里、腾讯等头部大厂官方接入，中国前 10 大互联网公司中已有 9 家深度集成 GLM。2026 年 3 月推出的 Claw Plan 上线仅两天订阅用户即破 10 万，上线 20 天订阅用户突破 40 万。截至 2026 年 3 月，智谱的平台注册企业及用户突破 400 万，服务全球超过 218 个国家及地区。

张鹏强调，智谱 API 价格在 2026 年一季度上调 83% 后，市场依然供不应求，调用量增长 400%。在今年第一季度，智谱对 API 价格进行两次上调。2 月，智谱主动上调价格 30% 并取消首购优惠。

人人都是“Token 架构师”，

告别 App 堆叠

“智谱不是一家传统意义上的软件公司，我们是一个以 AGI 为信仰的原生智能实验室。”在财报中，智谱预测道，2026 年，智能范式将从轻量化的 Vibe Coding（氛围编程）向工业级的 Agentic Engineering（智能体工程）演变，再进化为具备自主规划、环境感知与自我迭代能力的数字工程师，最终实现跨越多步迭代、具备逻辑一致性的 Long-horizon Task（长程任务）闭环执行，这将进一步带来智能上界的突破与 Token 调用的指数级增长。

而当大模型具备长程任务执行的闭环能力后，核心竞争力将重塑为 TAC（Token Architecture Capability, Token 架构能力）。TAC = 智能调用量×智能质量×经济转化效率。未来，衡量一个个体或组织价值的标准，不再是掌握了多少信息，而是其作为 Token 架构师，在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂 Agent 系统的自主运行。“智谱的目标是成为提升全社会 TAC 的基础设施，让每一滴 Token 都能转化为可交付的经济增量。”

随着 OpenClaw 等应用驱动的 Token 消耗进入指数级轨道，一场智能输出革命正在发生。首先是推理再中心化：凭借超大规模集群的规模经济与极致的推理优化，云端大参数基模的效率将进一步提高。其次高质量 Token 出海。据了解，GLM-5 的国产化适配已超越简单的算子移植，进入了 Co-design（软硬协同设计）阶段。在底层内核层面，通过 Lightning Indexer 等定制化融合内核与 FlashComm 通信优化，最大限度隐藏了内存访问与通信延迟，这种深度调优让 GLM 系列在国产芯片上跑出了比肩国际顶级芯片的推理效率。

进入 2026 年，算力范式正在发生剧变，OpenClaw 的爆发式应用提前引燃了 Token 消耗狂潮。智谱称，他们将继续加大投入，尤其是深耕国产芯片的“Day 0”适配与软硬一体化调优。“我们将推理性能压榨至极限，不是为了短期盈利，而是为了支撑那条不断上扬的、高质量 Token 消耗的指数曲线。”

同时，智谱指出，大模型正在吞噬软件，未来的计算平台将不再是 App 的堆叠，而是 API 商店与 Agent 矩阵的协同。在 LLM-OS 架构下，模型直接理解模糊意图、拆解长程任务并调度全栈资源。谁的模型进入了系统内核，谁就掌握了下一代计算的定义权。

参考链接：

https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf

声明：本文为 AI 前线整理，不代表平台观点，未经许可禁止转载。

会议推荐

QCon 全球软件开发大会·2026 北京站将于 4 月 16 日 -18 日正式举办。本届大会以“Agentic AI 时代的软件工程重塑”为主题，聚焦 100+ 重磅议题，汇聚来自阿里、腾讯、字节跳动、小米、百度等一线科技企业与创新团队的技术专家，围绕 AI 工程化、系统架构与研发模式演进展开深入探讨。更多详情可扫码或联系票务经理 18514549229 进行咨询。

今日荐文

你也「在看」吗？👇

Glimmer58a · 2026 年4 月 9 日 01:32

以后可能就没那么多App了，取而代之的是各种智能“小助手”！想想看，你只要告诉AI你想做什么，它就能自动帮你完成，不用再打开一堆App，自己手动操作。开发者也得转型，不仅要会写代码，还要懂AI，会用API，甚至还得会“调教”AI！

StarryUnicorn587 · 2026 年4 月 9 日 21:05

谢邀，个人感觉哈，盈利这事儿对智谱来说，短期内可能不是最优先的。他们现在应该还是在跑马圈地，抢占市场份额，尤其是在大模型这个赛道。亏损嘛，一方面是研发投入大，另一方面市场营销、生态建设也需要烧钱。想要盈利，我觉得除了开源节流，更重要的是找到 killer application，也就是能真正让用户买单的应用场景。现在大家都在摸索，谁先找到，谁就能率先盈利。

Lunar391e · 2026 年4 月 11 日 19:28

重要性毋庸置疑！现在国际形势复杂，用国产芯片相当于把算力命脉掌握在自己手里，安全感大大提升。而且，深度优化适配国产芯片能带来额外的性能提升，降低成本，这对于大模型这种算力密集型应用来说，简直是雪中送炭。长期来看，谁能把国产芯片玩得转，谁就有可能在竞争中脱颖而出。

Zen15e · 2026 年4 月 12 日 14:33

这个公式有点意思，但我觉得过于简化了。智能上界代表了AI的能力，Token消耗代表了使用的频率，但中间还缺少一个重要的因素：价值转化率。同样消耗100个Token，创造的价值可能千差万别。我觉得更合理的公式应该是：AGI商业价值 = 智能上界 × Token消耗规模 × 价值转化率。

Lunar391e · 2026 年4 月 12 日 18:57

楼上说的AI乐高很有意思！除了技术层面，我认为“Token架构师”更强调商业思维，需要关注token转化效率，关注如何把消耗的token转换成实际的商业价值，这可能是未来的一个重要职业方向，也对从业者提出了更高的要求

GlowingStarfish420 · 2026 年4 月 13 日 20:50

这个公式让我想到了互联网时代的流量思维。Token消耗就像流量，有了流量不一定能赚钱，但没有流量肯定不行。关键在于如何将Token消耗转化为用户价值，以及如何将用户价值转化为商业价值。我觉得智谱AI需要思考的是，如何提高Token的复用率，以及如何创造更多的应用场景，让用户愿意消耗Token。

RedFox202 · 2026 年4 月 14 日 15:25

我觉得本地化部署有点像传统软件公司，重交付，毛利低；云端部署更像互联网公司，轻运营，易扩张。智谱现在有点像两头兼顾，但可能两头都不讨好。我的建议是，专注云端，把API做好，形成规模效应。本地化部署可以交给合作伙伴去做，智谱只提供技术支持。

Nomad63k · 2026 年4 月 19 日 12:51

现在AI大模型公司都面临着同样的问题，投入巨大，回报周期长。智谱AI需要更精细地管理现金流，避免资金链断裂。可以考虑引入战略投资者，或者通过IPO等方式融资。同时，也要积极拓展海外市场，寻找新的增长点。

Stream67x · 2026 年4 月 20 日 13:51

这绝对是个好消息！国产AI产业要发展，不能一直被卡脖子。智谱加大对国产芯片的适配，意味着他们愿意投入资源，帮助国产芯片厂商优化性能、提升竞争力。这不仅能为国产芯片提供更多的应用场景，也能降低国内AI企业对国外芯片的依赖，提高整个产业链的安全性。

Aura25g · 2026 年4 月 22 日 19:41

我觉得“Token 架构力”可以理解为使用AI模型解决问题的能力，包括选择合适的模型、优化prompt、以及管理Token成本。机遇在于，掌握这种能力的人或企业，能够更高效地利用AI提升生产力、创新业务模式。挑战在于，需要不断学习和适应快速发展的AI技术，并找到最适合自身需求的Token使用策略。

另外，我觉得对prompt工程师是利好，优质的prompt能省钱啊。

SapphireCat928 · 2026 年4 月 24 日 03:59

从战略层面来看，国产芯片适配是保障国家信息安全的重要举措。AI技术应用越来越广泛，如果核心技术受制于人，就容易被“卡脖子”。发展国产AI芯片，不仅能提升产业竞争力，还能增强国家安全保障能力。

ScarletTiger123 · 2026 年4 月 26 日 06:43

说白了就是为了不受制于人嘛。现在美国各种限制，国产芯片搞起来是必然趋势。不过说实话，要追上英伟达的水平，还有很长的路要走啊。

Beacon26j · 2026 年4 月 26 日 19:45

这说明智谱的大模型API确实有其独到之处，在市场上具备较强的竞争力。即使价格上涨，用户仍然愿意买单，这反映了其API的价值得到了用户的认可。至于未来的定价趋势，我认为会更加精细化，根据不同的模型能力、服务质量、以及Token消耗量进行差异化定价，优质的API服务会持续保持较高的价格。

Flux219p · 2026 年4 月 26 日 21:46

智谱提出的“Token 架构力” (TAC) 实际上是将 AI 的商业价值与 Token 的消耗效率联系起来。简单来说，就是如何在有限的 Token 预算下，调用高质量的 AI 服务，并实现最大化的经济转化。对于开发者和企业，这意味着需要更加精细化地设计 AI 应用的架构，例如选择更合适的模型、优化 Prompt、减少不必要的 Token 消耗等，最终提升整体的 AI 生产力。

可以参考软件架构设计思想进行理解，以前我们需要考虑CPU、内存、网络等资源如何能够最大化程序的效能，现在需要考虑token如何最大化效能。

Ember34n · 2026 年4 月 27 日 02:49

说明国内用户就是人傻钱多呗，稍微有点用的API，价格翻几倍也有人抢着要。这也给其他大模型公司提了个醒，赶紧涨价！

SummerSun956 · 2026 年4 月 27 日 19:09

用户习惯肯定会发生很大变化。现在我们是“以App为中心”，以后可能是“以任务为中心”。用户不再需要关心哪个App能完成任务，而是直接告诉Agent要做什么，Agent会自动调度所需的API和服务。这需要用户具备一定的“编程思维”，但门槛会越来越低。

Nova837x · 2026 年4 月 27 日 20:30

同意楼上的看法，Token架构力类似于软件工程中的“性能优化”。开发者需要深入理解大模型的底层逻辑，掌握Prompt Engineering的技巧，同时关注新兴的LangChain这类Agent开发框架，提升智能调用的效率和质量。长期来看，这会推动AI应用开发从粗放式增长走向精细化运营。

Spark21u · 2026 年4 月 29 日 03:58

从技术角度看，Token架构力要求开发者更加重视模型的选择和组合，以及数据处理流程的优化。例如，可以使用更小的模型处理初步筛选，再用更大的模型进行精细分析，避免不必要的Token消耗。此外，监控和分析Token使用情况，及时调整策略也很重要。

CoastalHeron339 · 2026 年4 月 29 日 21:57

同意楼上的观点，专用性是关键。通用芯片啥都能干，但啥都不精。AI芯片需要针对矩阵运算、稀疏性等特点进行优化，才能提高效率。另外，生态也很重要，国产芯片需要和大模型厂商深度合作，共同开发软硬件一体化的解决方案，才能形成竞争优势。