亚马逊员工承认“刷 AI 用量”:刻意消耗词元冲内部排行榜
2 小时前 / 阅读约4分钟
来源:IT之家
亚马逊被曝员工虚增AI词元消耗量以达成内部指标,这种现象被称作“词元刷量”,已十分普遍。企业考核激励机制放大了虚耗乱象,影响AI基础设施采购需求数据的可信度。
感谢IT之家网友 不一样的体验 的线索投递!

IT之家 5 月 13 日消息,据英国《金融时报》报道,继上月 Meta 与微软被曝出员工存在类似行为后,亚马逊成为又一家出现员工刻意虚增 AI 词元(token)消耗量、以此达成内部使用指标的超大规模科技企业。

亚马逊设定考核目标,要求超 80% 的研发人员每周必须使用人工智能工具,并通过内部排行榜实时统计词元消耗数据。多名员工向《金融时报》透露,他们一直在使用公司自研智能体平台 MeshClaw,该平台可自主发起代码部署、邮件分类处理、联动职场通讯软件 Slack,员工借此刻意刷高 AI 词元使用量。亚马逊官方表示,工具使用数据不会纳入绩效考核,但多名员工认为管理层仍在暗中监控相关数据。有员工直言“公司施压要求必须使用这类 AI 工具的压力极大”,也有员工称这种数据排名机制催生了扭曲的逐利动机。

这种被业内称作“词元刷量(tokenmaxxing)”的现象如今已十分普遍,甚至衍生出专属行业术语和内部排名榜单。而抛开职场内卷文化不谈,若人工智能词元消耗中有相当一部分只是应付式虚假使用,那么全球数千亿美元 AI 基础设施采购所依据的市场需求数据,其可信度又能有多高?

亚马逊、微软、谷歌母公司 Alphabet、Meta 四家科技巨头 2026 年合计资本开支预估在 6500 亿至 7000 亿美元(IT之家注:现汇率约合 4.43 万亿至 4.77 万亿元人民币)区间,华尔街部分机构更是预测 2027 年这一数值将突破 1 万亿美元(现汇率约合 6.81 万亿元人民币)。各大超大规模企业均向投资者宣称,AI 推理算力一经部署便会迅速被市场吸纳。企业内部研发人员的工具使用量显然是算力消耗的组成部分,这类内部消耗与外部付费客户用量,共同构成企业规划算力规模、采购 GPU 芯片、高带宽内存(HBM)及配套电力基建的核心依据。

“词元刷量”并不代表人工智能整体需求完全造假:企业级 AI 应用渗透率确实在持续提升,推理算力负载也正规模化落地至生产场景。但应用普及度和消耗强度有着本质区别:前者是支撑行业需求的长期核心动力,后者却可以人为操控刷量,而当下企业自身设计的考核激励机制,进一步放大了这种虚耗乱象。另有报道称,AI 工具使用成本甚至高于真实人工成本,这也让行业现状愈发扑朔迷离。

Meta 的 AI 使用内部排行榜在丑闻曝光后仅维持数日便草草下线,亚马逊近期也已收紧团队整体使用数据的公开权限。一旦统计考核规则发生调整,由旧规则催生的虚高消耗强度也会随之回落。

英伟达首席执行官黄仁勋曾将人均研发人员词元消耗量列为核心行业指标,并直言:倘若一名年薪 50 万美元的技术人员,每年消耗的 AI 词元价值不足 25 万美元,他会对此深感担忧。英伟达的推理业务增长,本质依赖真实、可持续、可叠加的高效算力负载;而每一笔刻意虚增的词元消耗,占用的都是实打实的 GPU 算力资源。

Block 公司前 AI 工具工程副总裁安吉・琼斯在接受行业媒体 LeadDev 采访时表示,她认为行业未来会转向考核词元使用效率,而非单纯追捧使用总量。当前行业普遍提前数年敲定 GPU 订单与电力配套规划,规划背后的需求预测精准度至关重要。各大超大规模科技企业正按照知识型从业者人均年算力消耗数十万美元的行业预期大举基建。而这类算力消耗最终是创造实际业务价值,还是仅沦为职场应付式刷量,将直接决定今年近 7000 亿美元的基建投入,能带来多少长期稳定的商业回报。