AI 工具按 Token 计费加速：企业生产力红利开始面对成本清算

almosthuman2014 · 2026 年6 月 8 日 17:02

AI 按 token 计费加速，企业开始为生产力红利支付更高账单。

原文标题：「Token末日」来了！AI正迎来一场定价海啸

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651037813&idx=2&sn=6fb98472fb6756d277afaecfd4800f34&

冷月清谈：

微软 GitHub Copilot 将从 6 月 1 日起转向更细的 token 用量计费，不同模型之间成本差异明显，高级模型价格涨幅更高，引发“Tokenpocalypse”讨论。文章指出，随着 OpenAI、Anthropic 等头部 AI 公司面临盈利和上市压力，AI 服务涨价或将成为更普遍趋势。

企业端正在遭遇新的管理难题：过去鼓励员工尽量多用 AI，如今又必须控制 token 消耗，甚至可能出现员工一天烧完公司月度预算的情况。Uber 等公司也已因 AI 预算超支而设置使用上限。文章认为，AI 生产力并非免费红利，企业需要在效率提升、成本控制、员工依赖和预算治理之间重新找平衡。

    <div data-wct-type="discuss-section">
        <h3 data-wct-type="discuss-title">怜星夜思：</h3>
        <div data-wct-type="article-discuss">1、如果 AI 工具越来越贵，公司还应该强制员工使用吗？<br>2、按 token 计费会不会改变大家使用 AI 的方式？<br>3、企业依赖 AI 到“宕机就停工”，这算进步还是风险？<br>4、未来 AI 公司涨价，是商业必然还是短期泡沫后的反噬？<br></div>
    </div>
</div>
<div data-wct-type="original-content">
    <h2 data-wct-type="original-content-header">原文内容</h2>
    <!-- 原文具体内容 -->
    <div style="">

机器之心编辑部

最近，一个新词引发了广泛讨论：「Tokenpocalypse」（Token 末日）。

起因是微软对 GitHub Copilot 进行了一次定价重构。从 6 月 1 日起，Copilot 全面转向基于 token 的计费模式，不同模型之间的 token 成本乘数差异巨大，部分模型的单 token 价格是其他模型的 60 倍。

相关链接：https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/

而那些被用户公认为「真正好用」的高级模型，恰恰是涨幅最凶的那一批。

随着 Anthropic、OpenAI 等多家头部 AI 公司筹备上市，AI 公司将面临更加严峻的盈利压力，或许将迫使更多厂商跟进涨价。

使用 AI 的成本永远是企业扩张生产力不可避免的问题。前段时间兴起的「tokenmaxxing」风潮，比拼员工 Token 使用量的驱动力，随着 Token 末日的临近而将走到尽头。

「整个 tokenmaxxxing 的风潮，从兴起到巅峰再到被嫌弃，一共就六个月。」

企业的两难

这位来自大型企业的开发者描述了一个荒诞的困境：公司长期以来强制要求员工使用 AI 工具，token 用少了会被约谈。但新定价一来，token 用多了同样会被约谈。

更要命的是，Copilot 团队到目前为止还没能上线「员工级别 token 限额」功能。这意味着在新计费模式下，一个员工就可能在一天内烧光整个公司当月的 token 预算。

「我的工作已经不是用软件解决业务问题了，」这位开发者写道，「我的工作变成了解决 token 使用问题。」

评论区的吐槽更加精彩。一位用户总结道：「公司政策变成了：『用 AI 做所有事情，但小心别用太多，因为如果 LLM 消耗了太多 token 你会被停用，然后你会因为这个月剩下的时间没用 AI 而被批评。』」

企业过于重视 AI 生产力，可能也是一把双刃剑。

某位来自大型律所的信息主管甚至在 AI 研讨会上「炫耀」：他们的 AI 系统宕机后，律师们基本停工了，因为已经离不开 AI 了。

一个受过多年专业训练的人，居然自由地承认自己离了 AI 聊天框就不能工作？我会羞愧到开始反思自己的职业生涯。」

Uber 超支事件：行业缩影

现在大部分 AI 模型都有用量包，企业在控制预算上的问题，在 Token 逐渐按量计费的趋势下愈发严重。

Uber 在一个半月内走完了一条完整的弧线：先是发现「AI 预算比预想的烧得快得多」，然后紧急设置使用上限和员工限制。

相关链接：https://www.bloomberg.com/news/articles/2026-06-02/uber-caps-usage-of-ai-tools-like-claude-code-to-cut-costs

「想象一下，像 Uber 这样大量使用 AI 的公司都会这么快碰壁，」TechCrunch 的播客中谈到，「问题就是：AI 实验室能不能把成本降到和客户的支付意愿对接上？」

一个冷知识：ChatGPT Plus 最初定价 20 美元/月的时候，并没有什么战略考量，「就是随便吐了个数字出来」。整个行业到现在还在为这个起点买单。

「你的工作不会被 AI 取代，但你的预算可能会」

Reddit 上还有更多耐人寻味的细节。有人在公司建了一个 AWS Bedrock 成本监控面板，把每个模型、每个 token（包括缓存 token）的花费实时投到 CloudWatch 上，「让开发者和财务一起看钱烧」。评论区的反应是：「恭喜，你刚给他们提供了一个新的 KPI 指标。」

另一家大公司已经遭遇了类似的紧缩：AI 额度用完后，所有人被强制降级到 GPT-4.2，连 VSCode 集成都没了。

一位不在科技行业的旁观者说出了很多人的心声：「这整件事消耗的精神能量和实际工时，已经多到影响了真正能帮公司赚钱的工作交付。」

当整个行业还沉浸在「AI 将取代一切」的叙事中时，一个更现实的问题已经浮出水面：算力的账单，终究要有人来付。而「Token 末日」或许只是这场清算的开始。

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

OnyxHorse674 · 2026 年6 月 9 日 20:40

回应“商业必然还是泡沫反噬”：我更倾向于商业必然。大模型推理成本、研发成本、GPU 折旧都很高，早期低价更多是抢市场，等用户形成依赖后再回到真实价格。

IronKnight238 · 2026 年6 月 10 日 00:29

也有泡沫反噬的成分。过去两年大家默认 AI 能无限降本增效，但很多场景其实还没跑通商业账。现在涨价相当于把“补贴期幻觉”撕开了。

SilverWolf359 · 2026 年6 月 11 日 00:34

这个问题有点像当年公司强推上云。不是不能推，而是不能让所有人随便开机器不关。AI 也一样，强制使用没问题，但要配套额度、审计、模型分级，不然迟早出现“老板让用，财务让停”的名场面。

SilentWhale233 · 2026 年6 月 11 日 21:26

我站财务视角说一句：强制用可以，但必须先算 ROI。比如每月多花 10 万 token 费用，能不能少掉等价的人力、减少返工、加快交付？算不清就强推，本质上是把预算当信仰充值。

ShimmeringSeal612 · 2026 年6 月 12 日 10:40

说实话，最离谱的不是 AI 贵，而是有些公司把“用了 AI”当成工作先进性的证明。员工最后不是在解决业务问题，而是在证明自己没有落后于时代，这就很抽象。

Solace15k · 2026 年6 月 12 日 14:36

会，而且会逼出一堆“省 token 技巧”。比如短提示词、分层摘要、缓存上下文、低价模型先筛选、高价模型只做最终判断。以前拼 prompt engineering，以后可能还要拼 cost engineering。

Whisper51y · 2026 年6 月 14 日 18:14

普通用户可能感受没那么快，企业用户会非常明显。因为个人一个月多花几十美元还能忍，公司几千上万人一起烧 token，账单会变成管理层会议上的固定节目。