AI 刚出来的时候,老板们都以为裁员降本的机会来了。
想象的是,一个 AI 顶三个人、不眠不休、随叫随到、不用涨薪、不用社保,还能 24 小时在线。

听起来很完美,现实是 AI 确实不摸鱼,也确实不加班,它只是每多干一点,就多收一点钱。
以至于现在很多公司已经开始直呼:烧不起 token 了。
很多人第一反应都是:不至于吧?AI 不是越来越便宜吗? DeepSeek 出来以后,不都说大模型成本打下来了?
但很多人忽略了一件事:模型是降价了,可企业用得也越来越狠了。
从一个人偶尔用,到全员都在用,再到几十个 Agent 在后台 24 小时自己跑,结果就是单次调用是便宜了,月底账单却越来越贵。
比如,Uber 给 5000 名工程师开放 Claude Code ,短短几个月几乎烧光全年 AI 预算。

微软这段时间,也开始踩刹车,收紧内部 Claude Code 的使用权限,不再让工程师无限制调用。
说白了,就是之前那种“想怎么用就怎么用”的阶段,结束了。

亚马逊更直接,干脆把内部的 AI 使用排行榜给撤了。
原因很简单,他们发现一旦把“用了多少 AI ”当成指标,员工就会开始为了排名疯狂刷 token。
看起来所有人都在积极拥抱 AI,实际上很多调用根本没有产出,就是单纯“为了用而用”。

米哈游在一次多 Agent 实验里,几十个 Agent 在后台互相调用、互相等待、互相确认,你问我一句,我回你一句,你再确认我一下,谁都没有真正收尾,整个调用链越滚越长。
最后,一个晚上就烧掉了约200万元 token,而真正产出的价值却微乎其微。

看到这里,很多人可能会有个疑问:token 到底是什么?为什么能把一家公司烧成这样?
其实,token 可以理解成 A I世界里的电费。
你在聊天框里问一句,AI 几秒钟回你,看起来像是免费的。
但在企业后台,每输入一句话、每输出一段内容、每调用一次模型、每让 Agent 执行一个工具,甚至 AI 和 AI 之间互相讨论,都会产生 token 消耗。

更关键的是,AI 和传统软件的收费逻辑完全不是一回事。
以前买软件,成本基本是固定的。一个账号多少钱,一年预算多少,年初就能算个八九不离十。
AI 不一样,它是按使用量收费,而且这个使用量还会随着业务复杂度不断放大。
一个员工偶尔问几句,成本可能没多少;整个团队一起用,费用就开始往上涨。
等再接入 Agent,让 AI 自己调用 AI,账单很容易就从几千块变成几十万、几百万。

偏偏过去两年,整个社会都在鼓励大家多用 AI 。
提高 AI 渗透率、提高使用频率、提高自动化程度,有些公司甚至直接把 token 消耗量写进考核。
经济学里有个很经典的规律,叫古德哈特定律:当一个指标变成目标,它就不再是一个好指标。

国外甚至专门造了一个词,叫 Tokenmaxxing,大概可以理解成“把 token刷到极限”。
有人让 AI 反复优化同一段代码几十遍,有人让 AI 一口气生成十几个版本的报告。
还有人把一个本来几步就能完成的任务,硬拆成一堆 Agent 协作,只为了让系统看起来更智能,AI 越看越成了花架子。

平常小打小闹还能顶住,但真正把成本推到失控边缘的,其实是多 Agent 系统。
理论上,这套东西很美:一个 Agent 负责规划,一个负责执行,一个负责检查,一个负责总结,像个数字版团队协作。
但现实跑起来,它更像一个没人主持的项目会。
你问我,我问你;你等我,我等你;确认一轮不够再来一轮。所有人都在动,但事情就是收不了尾。
在大部分多 Agent 系统里,有 30% 到 60% 的 token,其实消耗在这种无意义的循环里。
说白了,大把的钱并没有变成结果,而是在 AI 们互相“开会”的过程中,一点一点烧没了。

更讽刺的是,这些 Agent 并不是在偷懒,反而是太认真了。
严格按照流程走,严格执行每一步逻辑,前一个 Agent 调后一个,后一个再回来确认前一个,直到整个系统把自己绕进死胡同。
这就有点像,某些公司几十个人在会议室里从晚上开会开到第二天早上,每个人都在发言,每个人都很投入,但没人拍板,会议还按秒收费。
而问题的关键在于,这种“会议”还会不断被复制、拆分、再嵌套,规模一放大,成本就开始呈指数级失控。
因为 AI 的成本从来不是一次性的,而是会随着调用链不断放大,而且几乎不可预测。

这时候大家已经不是在讨论“AI 好不好用”,而是在算一件更现实的事:这玩意儿到底会不会把账单干爆。
国产模型 DeepSeek、豆包突然被重新拿出来聊,也不是因为情怀,而是很现实的一句话:同样的活儿,可能便宜好几倍。

说白了就是,别啥都上最贵模型了,简单的丢给便宜的,复杂的再上大的。
企业开始明白 AI 不是一个“用得越多越厉害”的工具,它更像一个“用得越多越烧钱”的系统。
资本市场那边也跟着变脸,以前看 AI 公司,看的是谁调用多、谁增长猛、谁 token 烧得狠。
现在只看一个东西:ROI。你烧那么多token,到底有没有换回来钱。
一个很扎心的现实是:效率提升,真的不等于赚钱。
代码写快了一倍,但产品没多卖一单,那只是“更快地花钱”,不是赚钱。
更魔幻的是,这事已经不是个别公司在踩坑了。
有公司一个月在 Claude 上直接烧掉 5 亿美元,还出现过忘了设上限,然后 token 一路狂飙。
Meta 那边更离谱,内部还搞过一个排行榜叫 “Claudeonomics”,专门看谁用 AI 最多,第一名一个月干掉 31.2 万亿 token。
换算一下,这一个月烧掉的钱,够请两个资深工程师干一年。
可以说,一边老板在喊“全员 AI 化”,一边财务已经开始冒冷汗。
其实说到底,不是不用AI,而是不再无脑烧 token 了。
大家开始问一个更现实的问题:这些 token,到底有没有换回真金白银?
