智谱AI发布2025年度财报:营收增长迅猛,Token价值飙升,力追Anthropic

智谱AI财报:营收增长但亏损扩大,Token价值受重视,未来押注国产芯片和Agent生态。

原文标题:智谱AI财报炸场,Token价值暴涨、核心指标直追Anthropic水平!CEO张鹏:人人都将是“Token架构师”

原文作者:AI前线

冷月清谈:

智谱AI发布2025年度财报,营收7.24亿元,同比增长131.9%,但年内亏损扩大至47.18亿元。本地化部署服务是主要收入来源,但云端部署服务毛利率提升明显。智谱强调Token消耗规模的重要性,并提出“Token架构力”的概念,对标Anthropic,API平台ARR增长迅速。未来,智谱将加大国产芯片投入,并认为大模型将重塑计算平台,从App堆叠走向API商店与Agent矩阵协同。

怜星夜思:

1、智谱AI财报中提到“Token 架构力”的概念,这会对未来的AI应用开发产生什么影响?普通开发者应该如何准备以适应这种变化?
2、财报显示智谱AI在国产芯片适配上投入很多,这对于中国AI产业的发展意味着什么?你觉得国产芯片在AI领域的突破口在哪里?
3、智谱AI认为未来计算平台将从App堆叠走向API商店与Agent矩阵协同,你认同这个观点吗?如果是这样,对于用户来说,使用习惯会发生哪些变化?

原文内容

整理|华卫

昨日,智谱交出了 2025 年度业绩报告,这是其上市近三个月后的首份年度财报。今年 1 月 8 日,智谱登陆港交所,股价从发行价 116.2 港元一度冲至近 700 港元,目前市值超 3000 亿港元。

这份业绩报告喜忧参半,其收入激增但亦被分析师评增长低于预期,且综合毛利率不佳。智谱表示,公司预计通过收入增长和提升运营效率实现盈利,但尚未给出具体时间表。智谱还在财报中传达了一个信号,将继续加大投资,增加国产芯片在训练模型中的使用。

营收翻倍增长,亏损同比扩大

财报显示,智谱 2025 年营收 7.24 亿元,同比增长 131.9%;毛利 2.97 亿元,同比增长 68.7%;毛利率为 41.0%,较上年的 56.3% 下降 15.3 个百分点;年内亏损 47.18 亿元,同比扩大 59.5%;经调整后净亏损 31.82 亿元,同比扩大 29.1%;研发投入 31.8 亿元,同比增长 44.9%。

从营收情况来看,智谱是一家典型的大模型公司:收入增长很快,但亏损巨大;研发投入仍然非常重,强度达营收的 4.4 倍。此外,智谱的毛利率下降明显,整体综合毛利率由 2024 年的 56.3% 降至 41.0%。

收入结构上,智谱 2025 年以本地化部署服务为主。其中,本地化部署服务收入 5.34 亿元,同比增长 102.3%,占总收入的 73.7%;云端部署服务收入 1.90 亿元,同比增长 292.6%,占比 26.3%。需要注意的是,2025 年智谱这两种服务模式的毛利率变化不一。云端部署毛利率从上年的 3.3% 提升到 18.9%,改善不小;但本地化部署毛利率则从 66.0% 下降到 48.8%。

财报中对此的解释是,云端部署业务主要由于模型推理效率提升、算力规模扩张导致边际成本递减,同时价格有所增加;即通过对推理侧的极致工程优化,在大幅度降低单位成本的同时,实现了毛利表现的稳健提升;本地化部署业务由于为满足客户需求而投入了更多的交付资源。

具体按业务形态与核心产品线来拆分,智谱 2025 年的企业级通用大模型收入 3.66 亿元,占比 50.4%;开放平台及 API 收入 1.90 亿元,占比 26.3%;企业级智能体收入 1.66 亿元,占比 22.9%;技术服务及其他收入占比低。

值得一提的是,智谱所有业务收入相较 2024 年均同比增长。其中,企业级通用大模型收入增幅达 70.5%,开放平台及 API 的收入增幅达 292.6%,企业级智能体收入增幅达 248.8%,技术服务及其他收入增幅达 31.6%。

Token 价值大增,

核心指标直追 Anthropic 水平

“‘智能上界的突破’是这个时代唯一的物理第一性。如果说智能上界决定了技术的定价权,那么 Token 的消耗规模则决定了商业价值的体量。”智谱在财报中称,其内部推导出了一个简洁的公式: AGI 商业价值 = 智能上界×Token 消耗规模。2025 年,随着 GLM 在编程 (Coding) 与智能体 (Agent) 等元场景的深度渗透,智谱付费 Token 消耗量实现了指数级跃迁。凭借 GLM 系列,智谱实现了从开发者生态到全球化 MaaS (Model-as-a-Service) 平台的全面爆发。

据了解,在稍晚的智谱年度业绩发布电话会上,智谱 CEO 张鹏进一步提出了“Token 架构力”(Token Architect)新概念,将 AI 生产力价值定义为“智能调用量 × 智能质量 × 经济转化效率”。并且,张鹏表示,“当模型足够强,API 本身就是最好的商业模式。”

在业务模式上,智谱一直对标 Anthropic。Anthropic 的 CEO Dario Amodei 曾透露,公司 60% 至 75% 的收入来自 API,且明确将编程作为核心用例,因为"企业用例为模型改进提供了更强的激励"。智谱此次发布的财报中,表演最亮眼的也来自 API 平台。

财报显示,截至报告期末,智谱 API 平台 ARR 实现 17 亿元,过去一年提升 60 倍。2025 年推出的 GLM Coding Plan,付费开发者规模突破 24.2 万。GLM-5 发布后 24 小时内即获得字节、阿里、腾讯等头部大厂官方接入,中国前 10 大互联网公司中已有 9 家深度集成 GLM。2026 年 3 月推出的 Claw Plan 上线仅两天订阅用户即破 10 万,上线 20 天订阅用户突破 40 万。截至 2026 年 3 月,智谱的平台注册企业及用户突破 400 万,服务全球超过 218 个国家及地区。

张鹏强调,智谱 API 价格在 2026 年一季度上调 83% 后,市场依然供不应求,调用量增长 400%。在今年第一季度,智谱对 API 价格进行两次上调。2 月,智谱主动上调价格 30% 并取消首购优惠。

 人人都是“Token 架构师”,

告别 App 堆叠

“智谱不是一家传统意义上的软件公司,我们是一个以 AGI 为信仰的原生智能实验室。”在财报中,智谱预测道,2026 年,智能范式将从轻量化的 Vibe Coding(氛围编程)向工业级的 Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的 Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与 Token 调用的指数级增长。

而当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为 TAC(Token Architecture Capability, Token 架构能力)。TAC = 智能调用量×智能质量×经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为 Token 架构师,在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂 Agent 系统的自主运行。“智谱的目标是成为提升全社会 TAC 的基础设施,让每一滴 Token 都能转化为可交付的经济增量。”

随着 OpenClaw 等应用驱动的 Token 消耗进入指数级轨道,一场智能输出革命正在发生。首先是推理再中心化:凭借超大规模集群的规模经济与极致的推理优化,云端大参数基模的效率将进一步提高。其次高质量 Token 出海。据了解,GLM-5 的国产化适配已超越简单的算子移植,进入了 Co-design(软硬协同设计)阶段。在底层内核层面,通过 Lightning Indexer 等定制化融合内核与 FlashComm 通信优化,最大限度隐藏了内存访问与通信延迟,这种深度调优让 GLM 系列在国产芯片上跑出了比肩国际顶级芯片的推理效率。

进入 2026 年,算力范式正在发生剧变,OpenClaw 的爆发式应用提前引燃了 Token 消耗狂潮。智谱称,他们将继续加大投入,尤其是深耕国产芯片的“Day 0”适配与软硬一体化调优。“我们将推理性能压榨至极限,不是为了短期盈利,而是为了支撑那条不断上扬的、高质量 Token 消耗的指数曲线。”

同时,智谱指出,大模型正在吞噬软件,未来的计算平台将不再是 App 的堆叠,而是 API 商店与 Agent 矩阵的协同。在 LLM-OS 架构下,模型直接理解模糊意图、拆解长程任务并调度全栈资源。谁的模型进入了系统内核,谁就掌握了下一代计算的定义权。

参考链接:

https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

会议推荐

QCon 全球软件开发大会·2026 北京站将于 4 月 16 日 -18 日正式举办。本届大会以“Agentic AI 时代的软件工程重塑”为主题,聚焦 100+ 重磅议题,汇聚来自阿里、腾讯、字节跳动、小米、百度等一线科技企业与创新团队的技术专家,围绕 AI 工程化、系统架构与研发模式演进展开深入探讨。更多详情可扫码或联系票务经理 18514549229 进行咨询。

今日荐文

图片
你也「在看」吗?👇

以后可能就没那么多App了,取而代之的是各种智能“小助手”!想想看,你只要告诉AI你想做什么,它就能自动帮你完成,不用再打开一堆App,自己手动操作。开发者也得转型,不仅要会写代码,还要懂AI,会用API,甚至还得会“调教”AI!

谢邀,个人感觉哈,盈利这事儿对智谱来说,短期内可能不是最优先的。他们现在应该还是在跑马圈地,抢占市场份额,尤其是在大模型这个赛道。 亏损嘛,一方面是研发投入大,另一方面市场营销、生态建设也需要烧钱。想要盈利,我觉得除了开源节流,更重要的是找到 killer application,也就是能真正让用户买单的应用场景。现在大家都在摸索,谁先找到,谁就能率先盈利。

重要性毋庸置疑!现在国际形势复杂,用国产芯片相当于把算力命脉掌握在自己手里,安全感大大提升。而且,深度优化适配国产芯片能带来额外的性能提升,降低成本,这对于大模型这种算力密集型应用来说,简直是雪中送炭。长期来看,谁能把国产芯片玩得转,谁就有可能在竞争中脱颖而出。

这个公式有点意思,但我觉得过于简化了。智能上界代表了AI的能力,Token消耗代表了使用的频率,但中间还缺少一个重要的因素:价值转化率。同样消耗100个Token,创造的价值可能千差万别。我觉得更合理的公式应该是:AGI商业价值 = 智能上界 × Token消耗规模 × 价值转化率。

楼上说的AI乐高很有意思!除了技术层面,我认为“Token架构师”更强调商业思维,需要关注token转化效率,关注如何把消耗的token转换成实际的商业价值,这可能是未来的一个重要职业方向,也对从业者提出了更高的要求

这个公式让我想到了互联网时代的流量思维。Token消耗就像流量,有了流量不一定能赚钱,但没有流量肯定不行。关键在于如何将Token消耗转化为用户价值,以及如何将用户价值转化为商业价值。我觉得智谱AI需要思考的是,如何提高Token的复用率,以及如何创造更多的应用场景,让用户愿意消耗Token。

我觉得本地化部署有点像传统软件公司,重交付,毛利低;云端部署更像互联网公司,轻运营,易扩张。智谱现在有点像两头兼顾,但可能两头都不讨好。我的建议是,专注云端,把API做好,形成规模效应。本地化部署可以交给合作伙伴去做,智谱只提供技术支持。

现在AI大模型公司都面临着同样的问题,投入巨大,回报周期长。智谱AI需要更精细地管理现金流,避免资金链断裂。可以考虑引入战略投资者,或者通过IPO等方式融资。同时,也要积极拓展海外市场,寻找新的增长点。

这绝对是个好消息!国产AI产业要发展,不能一直被卡脖子。智谱加大对国产芯片的适配,意味着他们愿意投入资源,帮助国产芯片厂商优化性能、提升竞争力。这不仅能为国产芯片提供更多的应用场景,也能降低国内AI企业对国外芯片的依赖,提高整个产业链的安全性。

我觉得“Token 架构力”可以理解为使用AI模型解决问题的能力,包括选择合适的模型、优化prompt、以及管理Token成本。机遇在于,掌握这种能力的人或企业,能够更高效地利用AI提升生产力、创新业务模式。挑战在于,需要不断学习和适应快速发展的AI技术,并找到最适合自身需求的Token使用策略。

另外,我觉得对prompt工程师是利好,优质的prompt能省钱啊。

从战略层面来看,国产芯片适配是保障国家信息安全的重要举措。AI技术应用越来越广泛,如果核心技术受制于人,就容易被“卡脖子”。发展国产AI芯片,不仅能提升产业竞争力,还能增强国家安全保障能力。

说白了就是为了不受制于人嘛。现在美国各种限制,国产芯片搞起来是必然趋势。不过说实话,要追上英伟达的水平,还有很长的路要走啊。

这说明智谱的大模型API确实有其独到之处,在市场上具备较强的竞争力。即使价格上涨,用户仍然愿意买单,这反映了其API的价值得到了用户的认可。至于未来的定价趋势,我认为会更加精细化,根据不同的模型能力、服务质量、以及Token消耗量进行差异化定价,优质的API服务会持续保持较高的价格。

智谱提出的“Token 架构力” (TAC) 实际上是将 AI 的商业价值与 Token 的消耗效率联系起来。简单来说,就是如何在有限的 Token 预算下,调用高质量的 AI 服务,并实现最大化的经济转化。对于开发者和企业,这意味着需要更加精细化地设计 AI 应用的架构,例如选择更合适的模型、优化 Prompt、减少不必要的 Token 消耗等,最终提升整体的 AI 生产力。

可以参考软件架构设计思想进行理解,以前我们需要考虑CPU、内存、网络等资源如何能够最大化程序的效能,现在需要考虑token如何最大化效能。

说明国内用户就是人傻钱多呗,稍微有点用的API,价格翻几倍也有人抢着要。这也给其他大模型公司提了个醒,赶紧涨价!:dog_face:

用户习惯肯定会发生很大变化。现在我们是“以App为中心”,以后可能是“以任务为中心”。用户不再需要关心哪个App能完成任务,而是直接告诉Agent要做什么,Agent会自动调度所需的API和服务。这需要用户具备一定的“编程思维”,但门槛会越来越低。

同意楼上的看法,Token架构力类似于软件工程中的“性能优化”。开发者需要深入理解大模型的底层逻辑,掌握Prompt Engineering的技巧,同时关注新兴的LangChain这类Agent开发框架,提升智能调用的效率和质量。长期来看,这会推动AI应用开发从粗放式增长走向精细化运营。

从技术角度看,Token架构力要求开发者更加重视模型的选择和组合,以及数据处理流程的优化。例如,可以使用更小的模型处理初步筛选,再用更大的模型进行精细分析,避免不必要的Token消耗。此外,监控和分析Token使用情况,及时调整策略也很重要。

同意楼上的观点,专用性是关键。通用芯片啥都能干,但啥都不精。AI芯片需要针对矩阵运算、稀疏性等特点进行优化,才能提高效率。另外,生态也很重要,国产芯片需要和大模型厂商深度合作,共同开发软硬件一体化的解决方案,才能形成竞争优势。