AI 工具按 Token 计费加速:企业生产力红利开始面对成本清算

AI 按 token 计费加速,企业开始为生产力红利支付更高账单。

原文标题:「Token末日」来了!AI正迎来一场定价海啸

原文作者:机器之心

冷月清谈:

微软 GitHub Copilot 将从 6 月 1 日起转向更细的 token 用量计费,不同模型之间成本差异明显,高级模型价格涨幅更高,引发“Tokenpocalypse”讨论。文章指出,随着 OpenAI、Anthropic 等头部 AI 公司面临盈利和上市压力,AI 服务涨价或将成为更普遍趋势。

企业端正在遭遇新的管理难题:过去鼓励员工尽量多用 AI,如今又必须控制 token 消耗,甚至可能出现员工一天烧完公司月度预算的情况。Uber 等公司也已因 AI 预算超支而设置使用上限。文章认为,AI 生产力并非免费红利,企业需要在效率提升、成本控制、员工依赖和预算治理之间重新找平衡。
    <div data-wct-type="discuss-section">
        <h3 data-wct-type="discuss-title">怜星夜思:</h3>
        <div data-wct-type="article-discuss">1、如果 AI 工具越来越贵,公司还应该强制员工使用吗?<br>2、按 token 计费会不会改变大家使用 AI 的方式?<br>3、企业依赖 AI 到“宕机就停工”,这算进步还是风险?<br>4、未来 AI 公司涨价,是商业必然还是短期泡沫后的反噬?<br></div>
    </div>
</div>
<div data-wct-type="original-content">
    <h2 data-wct-type="original-content-header">原文内容</h2>
    <!-- 原文具体内容 -->
    <div style="">
图片
机器之心编辑部


最近,一个新词引发了广泛讨论:「Tokenpocalypse」(Token 末日)。


起因是微软对 GitHub Copilot 进行了一次定价重构。从 6 月 1 日起,Copilot 全面转向基于 token 的计费模式,不同模型之间的 token 成本乘数差异巨大,部分模型的单 token 价格是其他模型的 60 倍。



  • 关链接:https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/


而那些被用户公认为「真正好用」的高级模型,恰恰是涨幅最凶的那一批。


随着 Anthropic、OpenAI 等多家头部 AI 公司筹备上市,AI 公司将面临更加严峻的盈利压力,或许将迫使更多厂商跟进涨价。


使用 AI 的成本永远是企业扩张生产力不可避免的问题。前段时间兴起的 「tokenmaxxing」 风潮,比拼员工 Token 使用量的驱动力,随着 Token 末日的临近而将走到尽头。


「整个 tokenmaxxxing 的风潮,从兴起到巅峰再到被嫌弃,一共就六个月。」


企业的两难


这位来自大型企业的开发者描述了一个荒诞的困境:公司长期以来强制要求员工使用 AI 工具,token 用少了会被约谈。但新定价一来,token 用多了同样会被约谈。



更要命的是,Copilot 团队到目前为止还没能上线「员工级别 token 限额」功能。这意味着在新计费模式下,一个员工就可能在一天内烧光整个公司当月的 token 预算。


「我的工作已经不是用软件解决业务问题了,」这位开发者写道,「我的工作变成了解决 token 使用问题。」



评论区的吐槽更加精彩。一位用户总结道:「公司政策变成了:『用 AI 做所有事情,但小心别用太多,因为如果 LLM 消耗了太多 token 你会被停用,然后你会因为这个月剩下的时间没用 AI 而被批评。』」


企业过于重视 AI 生产力,可能也是一把双刃剑。



某位来自大型律所的信息主管甚至在 AI 研讨会上「炫耀」:他们的 AI 系统宕机后,律师们基本停工了,因为已经离不开 AI 了。


一个受过多年专业训练的人,居然自由地承认自己离了 AI 聊天框就不能工作?我会羞愧到开始反思自己的职业生涯。」


Uber 超支事件:行业缩影


现在大部分 AI 模型都有用量包,企业在控制预算上的问题,在 Token 逐渐按量计费的趋势下愈发严重。



Uber 在一个半月内走完了一条完整的弧线:先是发现「AI 预算比预想的烧得快得多」,然后紧急设置使用上限和员工限制。



相关链接:https://www.bloomberg.com/news/articles/2026-06-02/uber-caps-usage-of-ai-tools-like-claude-code-to-cut-costs


「想象一下,像 Uber 这样大量使用 AI 的公司都会这么快碰壁,」TechCrunch 的播客中谈到,「问题就是:AI 实验室能不能把成本降到和客户的支付意愿对接上?」


一个冷知识:ChatGPT Plus 最初定价 20 美元/月的时候,并没有什么战略考量,「就是随便吐了个数字出来」。整个行业到现在还在为这个起点买单。


「你的工作不会被 AI 取代,但你的预算可能会」


Reddit 上还有更多耐人寻味的细节。有人在公司建了一个 AWS Bedrock 成本监控面板,把每个模型、每个 token(包括缓存 token)的花费实时投到 CloudWatch 上,「让开发者和财务一起看钱烧」。评论区的反应是:「恭喜,你刚给他们提供了一个新的 KPI 指标。」



另一家大公司已经遭遇了类似的紧缩:AI 额度用完后,所有人被强制降级到 GPT-4.2,连 VSCode 集成都没了。


一位不在科技行业的旁观者说出了很多人的心声:「这整件事消耗的精神能量和实际工时,已经多到影响了真正能帮公司赚钱的工作交付。」


当整个行业还沉浸在「AI 将取代一切」的叙事中时,一个更现实的问题已经浮出水面:算力的账单,终究要有人来付。而「Token 末日」或许只是这场清算的开始。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


回应“商业必然还是泡沫反噬”:我更倾向于商业必然。大模型推理成本、研发成本、GPU 折旧都很高,早期低价更多是抢市场,等用户形成依赖后再回到真实价格。

3 个赞

也有泡沫反噬的成分。过去两年大家默认 AI 能无限降本增效,但很多场景其实还没跑通商业账。现在涨价相当于把“补贴期幻觉”撕开了。

3 个赞

这个问题有点像当年公司强推上云。不是不能推,而是不能让所有人随便开机器不关。AI 也一样,强制使用没问题,但要配套额度、审计、模型分级,不然迟早出现“老板让用,财务让停”的名场面。

1 个赞

我站财务视角说一句:强制用可以,但必须先算 ROI。比如每月多花 10 万 token 费用,能不能少掉等价的人力、减少返工、加快交付?算不清就强推,本质上是把预算当信仰充值。

3 个赞

说实话,最离谱的不是 AI 贵,而是有些公司把“用了 AI”当成工作先进性的证明。员工最后不是在解决业务问题,而是在证明自己没有落后于时代,这就很抽象。

1 个赞

会,而且会逼出一堆“省 token 技巧”。比如短提示词、分层摘要、缓存上下文、低价模型先筛选、高价模型只做最终判断。以前拼 prompt engineering,以后可能还要拼 cost engineering。

1 个赞

普通用户可能感受没那么快,企业用户会非常明显。因为个人一个月多花几十美元还能忍,公司几千上万人一起烧 token,账单会变成管理层会议上的固定节目。

1 个赞