浙大与阿里云提出「Token经济学」:用经济学重构大模型Agent的资源分配

浙大与阿里云提出Token经济学框架,用经济学视角分析大模型Agent的成本、协作与安全。

原文标题:首次系统定义「Token经济学」,浙大&阿里联合发布大模型Agent资源分配新范式

原文作者:机器之心

冷月清谈:

浙江大学与阿里云等机构发布综述《Token Economics for LLM Agents》,提出「Token经济学」研究范式,将Token从单纯文本/计算单位扩展为生产要素、交换媒介和记账单位,用来分析大模型Agent在成本、质量、协作和安全之间的权衡。文章指出,现代Agent依赖记忆、规划、工具调用和自我修正,复杂任务的Token消耗远高于普通对话,传统依靠堆算力和加参数的方式难以持续。该框架从四个层面展开:单智能体层面关注内部推理与外部工具调用的成本替代;多智能体层面分析协作带来的通信、同步和上下文传递成本;生态层面讨论共享推理平台中的拥堵定价、QoS分层和开源模型对闭源定价的影响;安全层面则把注入攻击、检索投毒、隐私保护等问题纳入Token成本核算。该研究强调,Agentic AI未来不仅要追求能力提升,也要关注可定价、可治理和可持续运行。

怜星夜思:

1、如果把Token看成一种“货币”,这会不会改变我们设计Agent产品的方式?
2、多Agent系统听起来很强,但协作成本会不会反而拖垮效率?
3、文章提到推理成本下降可能带来更大Token需求,这和现实中的AI使用体验吻合吗?
4、安全问题被纳入Token成本核算后,会不会让企业更愿意投入AI安全?

原文内容


当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景,一个隐秘却致命的瓶颈正在浮现:Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板,我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解?


近日,浙江大学与阿里云等机构的研究团队联合发布首篇《Token Economics for LLM Agents: A Dual-View Study from Computing and Economics》综述。


该工作首次将计算机科学与经济学深度融合,正式提出「Token 经(Token Economics)研究范式,将 Token 重新定义为生产要素、交换媒介与记账单位,构建了一套从单智能体到多智能体生态的完整经济分析框架,为下一代可扩展、可定价、可治理的 Agentic AI 系统奠定理论基石。



  • arXiv:https://arxiv.org/pdf/2605.09104

  • GitHub 项目:https://github.com/SuDIS-ZJU/Token-Economics


论文与相关资源将持续更新,欢迎社区交流与共建。


一、 为什么我们需要 “Token 经济学”?


过去三年,Agent 技术栈经历了爆发式演进。但与传统单次 LLM 推理不同,现代 Agent 依赖 “记忆-规划-工具调用-自我修正” 的迭代循环,单次复杂任务即可消耗上千倍于普通对话的 Token。


OpenRouter 公开数据显示,2024 年 12 月至 2026 年 3 月,平台周 Token 处理量从 0.4 万亿激增至 27.0 万亿,15 个月内暴涨近 68 倍。算力需求飙升、多 Agent 协作摩擦加剧、安全防御成本隐性化…… 现有研究多局限于系统加速、架构设计或安全防御的 “技术孤岛”,缺乏统一语言来量化 “算法能力” 与 “协同开销” 之间的根本权衡。




研究团队指出:当 AI 数据中心被产业重新定义为 “AI 工厂”,Token 已不再是单纯的数据单元,而是驱动智能生产的 “基础货币”。推理加速与算法优化,必须从工程选择升维为经济命题。


二、 核心框架:四维透镜下的 Agent 资源分配


该综述首创 “计算-经济” 双重视角,将 Agent 系统架构演进与经济组织形态严格同构映射,提出四大分析维度:



①微观层(单智能体):新古典厂商理论与要素替代


将单 Agent 视为独立企业,在预算约束下动态权衡 “内部推理 Token” 与 “外部工具 Token”。研究基于 CES 生产函数建模,证明 Agent 可通过要素替代逼近帕累托最优。例如:用少量高价值 API 调用替代冗长内部幻觉推理,实现成本最小化。



②中观层(多智能体系统):交易成本与委托代理理论


MAS 的扩张如同企业层级制,专业化带来收益,但跨 Agent 状态同步、上下文传递与格式对齐会引发超线性增长的 “内部交易成本”。研究指出,通信拓扑剪枝、消息级压缩与 KV Cache 跨模型共享,是降低 “协作摩擦税” 的关键杠杆。



③宏观层(Agent 生态):机制设计与拥堵外部性


在多租户共享推理平台上,Token 成为稀缺算力资源的计价单位。研究引入拥堵定价、QoS 分层与 Prompt 缓存经济学,揭示开源模型如何通过 “可信外部选项” 打破闭源定价垄断,并指出 “杰文斯悖论”:推理成本下降反而刺激总需求扩张,使系统长期处于动态拥堵状态。



④安全层:经济约束


首次将安全风险内化为 Token 经济损耗。注入攻击、检索投毒与隐私保护不再只是 “合规外挂”,而是直接改变 Token 影子价格、抬高验证成本、放大系统福利损失的核心变量。安全机制应被视为拦截 “缺陷 Token” 的质量控制基础设施。


三、 从理论到前沿:五大演进方向


基于该框架,团队勾勒出 Token 经济学走向工程落地的五大趋势:




结语


《Token Economics for LLM Agents》不仅是一篇综述,更是一份 Agentic AI 的经济学基础设施蓝图。它打破了计算机科学与经济学的学科壁垒,清晰传递出一个信号:在智能体时代,“算得准” 不如 “算得省”,“跑得快” 不如 “协同优”。随着大模型应用向生产核心渗透,Token 经济学将成为衡量 AI 系统商业可行性、工程可持续性与生态健康度的核心标尺。


欢迎学术界与产业界同仁共同探讨、验证与拓展这一新兴交叉领域。


团队


浙江大学计算机学院 × 浙江大学经济学院 × 区块链与数据安全国家重点实验室 × 阿里云



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

我做过一点类似流程编排,感受是:多Agent最怕职责不清。一个Agent写计划,一个Agent执行,一个Agent检查,这还行;如果每个Agent都想当领导,就会进入开会模式,Token全花在扯皮上。

3 个赞

多Agent系统不是不行,但要有“少说废话”的机制,比如消息压缩、状态共享、只传关键变量、必要时合并角色。否则就是一群机器人开周会,会议纪要写了三万字,事情还没开始干。

2 个赞

安全成本显性化是好事。很多AI系统现在的问题是,安全像外挂补丁,出了事才加。要是从一开始就把不可信输入、检索投毒、越权调用都算进运行成本,架构会稳很多。

1 个赞