浙大与阿里云提出「Token经济学」：用经济学重构大模型Agent的资源分配

almosthuman2014 · 2026 年6 月 4 日 14:27

浙大与阿里云提出Token经济学框架，用经济学视角分析大模型Agent的成本、协作与安全。

原文标题：首次系统定义「Token经济学」，浙大&阿里联合发布大模型Agent资源分配新范式

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651037049&idx=3&sn=d969eab02dd2b4907f19aa69f5b37b9a&

冷月清谈：

浙江大学与阿里云等机构发布综述《Token Economics for LLM Agents》，提出「Token经济学」研究范式，将Token从单纯文本/计算单位扩展为生产要素、交换媒介和记账单位，用来分析大模型Agent在成本、质量、协作和安全之间的权衡。文章指出，现代Agent依赖记忆、规划、工具调用和自我修正，复杂任务的Token消耗远高于普通对话，传统依靠堆算力和加参数的方式难以持续。该框架从四个层面展开：单智能体层面关注内部推理与外部工具调用的成本替代；多智能体层面分析协作带来的通信、同步和上下文传递成本；生态层面讨论共享推理平台中的拥堵定价、QoS分层和开源模型对闭源定价的影响；安全层面则把注入攻击、检索投毒、隐私保护等问题纳入Token成本核算。该研究强调，Agentic AI未来不仅要追求能力提升，也要关注可定价、可治理和可持续运行。

怜星夜思：

1、如果把Token看成一种“货币”，这会不会改变我们设计Agent产品的方式？
2、多Agent系统听起来很强，但协作成本会不会反而拖垮效率？
3、文章提到推理成本下降可能带来更大Token需求，这和现实中的AI使用体验吻合吗？
4、安全问题被纳入Token成本核算后，会不会让企业更愿意投入AI安全？

原文内容

当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景，一个隐秘却致命的瓶颈正在浮现：Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板，我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解？

近日，浙江大学与阿里云等机构的研究团队联合发布首篇《Token Economics for LLM Agents: A Dual-View Study from Computing and Economics》综述。

该工作首次将计算机科学与经济学深度融合，正式提出「Token 经济学」（Token Economics）研究范式，将 Token 重新定义为生产要素、交换媒介与记账单位，构建了一套从单智能体到多智能体生态的完整经济分析框架，为下一代可扩展、可定价、可治理的 Agentic AI 系统奠定理论基石。

arXiv：https://arxiv.org/pdf/2605.09104
GitHub 项目：https://github.com/SuDIS-ZJU/Token-Economics

论文与相关资源将持续更新，欢迎社区交流与共建。

一、为什么我们需要 “Token 经济学”？

过去三年，Agent 技术栈经历了爆发式演进。但与传统单次 LLM 推理不同，现代 Agent 依赖 “记忆-规划-工具调用-自我修正” 的迭代循环，单次复杂任务即可消耗上千倍于普通对话的 Token。

OpenRouter 公开数据显示，2024 年 12 月至 2026 年 3 月，平台周 Token 处理量从 0.4 万亿激增至 27.0 万亿，15 个月内暴涨近 68 倍。算力需求飙升、多 Agent 协作摩擦加剧、安全防御成本隐性化…… 现有研究多局限于系统加速、架构设计或安全防御的 “技术孤岛”，缺乏统一语言来量化 “算法能力” 与 “协同开销” 之间的根本权衡。

研究团队指出：当 AI 数据中心被产业重新定义为 “AI 工厂”，Token 已不再是单纯的数据单元，而是驱动智能生产的 “基础货币”。推理加速与算法优化，必须从工程选择升维为经济命题。

二、核心框架：四维透镜下的 Agent 资源分配

该综述首创 “计算-经济” 双重视角，将 Agent 系统架构演进与经济组织形态严格同构映射，提出四大分析维度：

①微观层（单智能体）：新古典厂商理论与要素替代

将单 Agent 视为独立企业，在预算约束下动态权衡 “内部推理 Token” 与 “外部工具 Token”。研究基于 CES 生产函数建模，证明 Agent 可通过要素替代逼近帕累托最优。例如：用少量高价值 API 调用替代冗长内部幻觉推理，实现成本最小化。

②中观层（多智能体系统）：交易成本与委托代理理论

MAS 的扩张如同企业层级制，专业化带来收益，但跨 Agent 状态同步、上下文传递与格式对齐会引发超线性增长的 “内部交易成本”。研究指出，通信拓扑剪枝、消息级压缩与 KV Cache 跨模型共享，是降低 “协作摩擦税” 的关键杠杆。

③宏观层（Agent 生态）：机制设计与拥堵外部性

在多租户共享推理平台上，Token 成为稀缺算力资源的计价单位。研究引入拥堵定价、QoS 分层与 Prompt 缓存经济学，揭示开源模型如何通过 “可信外部选项” 打破闭源定价垄断，并指出 “杰文斯悖论”：推理成本下降反而刺激总需求扩张，使系统长期处于动态拥堵状态。

④安全层：经济约束

首次将安全风险内化为 Token 经济损耗。注入攻击、检索投毒与隐私保护不再只是 “合规外挂”，而是直接改变 Token 影子价格、抬高验证成本、放大系统福利损失的核心变量。安全机制应被视为拦截 “缺陷 Token” 的质量控制基础设施。

三、从理论到前沿：五大演进方向

基于该框架，团队勾勒出 Token 经济学走向工程落地的五大趋势：

结语

《Token Economics for LLM Agents》不仅是一篇综述，更是一份 Agentic AI 的经济学基础设施蓝图。它打破了计算机科学与经济学的学科壁垒，清晰传递出一个信号：在智能体时代，“算得准” 不如 “算得省”，“跑得快” 不如 “协同优”。随着大模型应用向生产核心渗透，Token 经济学将成为衡量 AI 系统商业可行性、工程可持续性与生态健康度的核心标尺。

欢迎学术界与产业界同仁共同探讨、验证与拓展这一新兴交叉领域。

团队

浙江大学计算机学院 × 浙江大学经济学院 × 区块链与数据安全国家重点实验室 × 阿里云

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

Whisper51y · 2026 年6 月 7 日 05:08

我做过一点类似流程编排，感受是：多Agent最怕职责不清。一个Agent写计划，一个Agent执行，一个Agent检查，这还行；如果每个Agent都想当领导，就会进入开会模式，Token全花在扯皮上。

SwiftGazelle777 · 2026 年6 月 9 日 00:10

多Agent系统不是不行，但要有“少说废话”的机制，比如消息压缩、状态共享、只传关键变量、必要时合并角色。否则就是一群机器人开周会，会议纪要写了三万字，事情还没开始干。

Halo30p · 2026 年6 月 11 日 14:33

安全成本显性化是好事。很多AI系统现在的问题是，安全像外挂补丁，出了事才加。要是从一开始就把不可信输入、检索投毒、越权调用都算进运行成本，架构会稳很多。