随着云计算从以CPU(中央处理器)为核心的通用计算,逐步走向以GPU(图形处理器)为代表的智能计算,AI云正在成为中国乃至全球云市场的共识。
在这一过程中,MaaS(模型即服务)平台正在成为绕不开的一环。因为,通过MaaS调用模型、消耗 Token(词元),已经是企业使用AI云的一种重要形式。
过去一年,围绕Token的调用量、增速、规模乃至排名,讨论明显升温(详见《中国AI云市场,究竟谁是“第一”?》)。近一年,国内外云厂商(包括亚马逊AWS、微软Azure、谷歌云GCP,阿里云、百度智能云、火山引擎)都在不同时间、不同程度地披露了自己的Token消耗相关情况。
Token甚至像流量一样,成为重要统计指标。国家数据局2025年8月数据显示,2024年初中国日均Token消耗量1000亿。截至2025年6月底,中国日均Token消耗量突破30万亿。一年半时间增长了300多倍,这反映了中国AI应用规模的快速增长。
换句话说,当下的AI云市场,Token正成为部分从业者眼中的“北极星指标”。所谓“北极星指标”,可理解为“核心指标”,指企业内能代表最终成功,指引所有团队努力方向的指标。它像北极星一样,为整个组织提供清晰、统一的战略指引。
之所以会出现这种状态,一个重要原因是,Token是当前最直观、最容易量化,也最容易比较的指标之一。它有极高的叙事效率——既方便市场传播,也容易被资本和客户理解。
这个观点得到了多位行业人士的认同。一位中国云厂商架构师对我们表示,商业世界往往更偏好简单、清晰的单一指标。2025年6月,一位国际市场调研机构分析师在一场小规模讨论提到,AI云市场发展初期,Token调用量相对容易衡量。但他同时认为,长期来看营收规模才是更重要的指标。
当一个指标被当作“北极星”,它是否也可能遮蔽其他重要事实?答案是肯定的。
其一,无论是在中国还是美国,当前各大云厂商的Token收入,在整体云收入中的占比仍然较低。至少在目前,Token市场的规模,尚不足以单独支撑起云市场的整体增长。
其二,现有的Token统计存在盲区。市场调研机构披露的Token消耗量,大多基于公共云MaaS平台的API(应用程序接口)调用数据。但由于技术和部署方式的限制,它很难全面覆盖所有应用场景。这意味着,发生在GPU云租赁、私有化部署,以及制造、汽车、机器人等设备端的AI算力使用,往往并未被完整计入。这可能会低估AI的真实使用规模。
其三,在企业真实IT采购逻辑中,Token更多是使用之后的结果,而非核心采购决策依据。企业决策往往围绕AI是否能够进入业务流程、能否降低成本等问题展开。Token消耗量,通常不会在采购阶段被单独列为核心指标。
简单理解,Token是AI云的重要组成部分,但将其等同于AI云本身,或作为唯一衡量标准,仍为时过早且不够科学。它无法全面呈现中国数字化市场的复杂性和多样性。
通过MaaS平台使用Token,这代表了相当一部分前沿开发者、AI创新企业的前沿需求。无论是中国、美国云厂商,都对这部分市场保持着战略关注。
包括亚马逊AWS、阿里云等在内的全球云厂商,都在积极探索如何扩大MaaS业务规模。
亚马逊AWS管理层2025年10月财报电话会议披露,长远来看,Bedrock(亚马逊AWS的MaaS平台)收入贡献将与EC2(亚马逊AWS的CPU和GPU计算实例业务,总营收占比超过30%)不相上下。但亚马逊AWS管理层未披露,Bedrock收入的详细统计口径,以及上述目标的具体实现时间。
我们了解到,阿里云在2025年11月末启动了“百炼战役”,目标是短期内将百炼(阿里云的MaaS平台)Token调用规模提升三倍以上。阿里云还为之成立了专门的销售组织。在字节跳动旗下的火山引擎,Token收入已是销售团队KPI考核核心指标之一。
2025年12月末,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中对我们表示,他认同亚马逊AWS对MaaS收入长期增长的判断。他的看法是,当模型能力持续增强、Agent(智能体)逐步成熟,并覆盖大量IT能力有限的长尾企业后,MaaS收入在云厂商整体收入的占比,有可能达到30%甚至更高。但他同时强调,目前行业仍处于早期阶段,过早给出明确的市场规模或占比,并不具备现实意义。
多份市场调研数据表明,目前Token市场增速很快,但在AI云市场规模仍然有限。短期内,它尚不足以单独支撑起中国云市场大盘的整体增长。
国际市场调研机构Omdia 2025年9月数据显示,2024年中国AI云市场规模约29亿美元,其中AI IaaS(基础设施)23亿美元,占比79%;AI PaaS(平台软件)5.6亿美元,占比24%;AI MaaS收入规模0.3亿美元,占比1%。
Omdia预测,2025年中国AI云市场规模将增长至72亿美元,2030年将增长至268亿美元。2030年AI MaaS市场规模将达到25亿美元。按照这一预测,AI MaaS 2030年在AI云市场占比约为9%。

我们了解到的情况是,2024年中国主要云厂商Token收入总和不超过10亿元。2025年各个云厂商Token收入增长均大幅增长。目前Token收入高的云厂商超过10亿元,但Token收入低的云厂商约为数亿元。在一些规模相对较小的云厂商收入结构中,Token收入可能达到10%左右。但在头部云厂商收入结构中,Token收入占比仅为1%左右。
围绕Token收入未来的增长空间,行业内部也存在不同测算。Omdia预测相对保守,市场上也存在一些更乐观的预测口径。
中国某ICT硬件企业的一位资深战略规划人士2025年7月曾对一些中国云厂商未来可能的Token收入进行了敏感性测试(一种根据商业模型,综合外部市场条件变化进行市场动态分析的方法)。
他对我们表示,如果Token价格依旧维持当前水平,他测试的结果显示,某中国云厂商Token调用收入未来1年-2年可能增长至40亿-70亿元。但他同时强调,这一测算高度依赖模型能力、应用渗透率及Token定价的变化,并不等同于行业整体判断。
按照这种增长预判,Token收入在部分云厂商的营收大盘占比会更大,可能会成为部分新兴云厂商的主要营收增长来源。但它在短期内(未来1年-3年)仍无法构成中国AI云市场大盘的核心增长来源。
某国内头部云厂商的一位高管和国内某大模型平台业务负责人在2025年12月在两场不同的对话中,分别对我们表达了同一个观点:AI云市场仍处于早期发展,如果过于强调Token市场的规模乃至排名,容易用短期指标替代对长期增长结构的判断。
上述中国大模型平台业务负责人提到,他所在的云厂商并未参与Token相关争论。在他看来,中国云厂商关于Token叙事的差异,并非AI云技术路线的根本分歧,而是客户结构与历史业务基础不同而导致的差异。
他进一步解释,阿里云强调多形态并存(GPU云租赁+MaaS调用+私有化部署)并非保守,这是因为它诞生16年形成了庞大多样的客户结构(互联网、金融、制造、公共部门、中小企业、AI创业企业和前沿开发者等),它需要尊重所有客户需求。火山引擎更强调Token是因为,豆包App等公司内部业务Token消耗占比高,云业务的核心客户以前沿开发者、AI创业公司为主。Token消耗增长快,这是“后来者”容易讲清增长叙事的一条路。
AI云仍在发展早期。一个高度复杂、仍在快速演进的技术体系中,单一指标一旦被赋予过多意义,往往也容易遮蔽一些更难被量化却更关键的事实。
目前,使用AI算力的形式非常多样——通过公共云租赁GPU部署模型、采购GPU服务器进行模型私有化部署后进行后训练或强化学习、MaaS平台调用Token、端侧算力部署模型等都是主流方案。

不同类型的企业通常倾向于采用不同的方案。比如,大型互联网公司通常习惯租用GPU云服务。政企行业(如金融、能源、制造等行业)和公共部门主要是采购GPU硬件进行私有化部署,AI创业公司和前沿开发者则是倾向于选择MaaS平台调用Token。在汽车、机器人、行业设备场景中,往往又是通过本地或边缘环境使用算力。
此外,每一家企业的AI算力使用形态,都不是单一的。据我们了解,阿里云70%的企业客户,租用GPU云服务的同时,也通过MaaS平台调用Token。深度使用AI的企业,通常是多形态并存。
某零售企业的数字化策略负责人对我们表示,他们在AI应用PMF(产品市场匹配)验证阶段,优先通过MaaS平台调用模型进行可行性测试,因为Token计费方式更灵活、试错成本更低。当AI应用进入大规模部署阶段后,倾向于租用GPU实例,因为长期成本结构更可控。
此外,某国内云厂商的一位资深架构师也对我们表示,他走访客户发现,一些制造企业既采购GPU硬件进行私有化部署,也使用MaaS平台。其中,数据敏感型的业务使用本地算力,非敏感业务通过MaaS平台使用Token。他认为,Token计费灵活,这客观上加速了制造企业的上云进程。
我们通过综合调研了解到,某社交媒体、某支付平台每年云支出(含计算、存储、网络、数据库、MaaS等公共云产品)高达数十亿乃至百亿元。这类头部互联网企业,2025年直接通过MaaS平台使用Token的费用,在整体云支出中的占比为极低的个位数。
一位头部社交媒体相关人士2025年11月曾对我们表示,他所在企业的云支出仍以计算、存储、网络、数据库为主。AI算力相关投入以GPU云租赁、自建推理与训练集群等方式为主,MaaS产生的Token消耗少之又少。
另一个重要事实是,中国市场可被统计到的Token消耗,主要集中在娱乐、对话等To C(面向消费者)的移动互联网场景。这类应用更容易通过MaaS调用模型,更容易在早期形成可观的Token规模。但更广阔的To B(面向企业级)领域,目前仍在AI应用早期,未来增长潜力更大。
综上所述,真实Token使用场景,远比统计口径更复杂、多样。由于技术所限,不同机构很难全面掌握所有场景的Token使用情况。如果只看单一的统计数据,很容易得出彼此矛盾的结论。
国际市场调研机构IDC 2025年数据显示,截至2025上半年,阿里云在中国大模型公有云服务(即Token市场)占比为27.0%,位居第二。阿里云在这里似乎是被低估的。
OpenRouter是全球大模型API聚合平台,集成了全球主流模型,它反映了全球前沿开发者和AI创新企业的使用习惯。OpenRouter数据显示,2025年阿里Qwen系列模型全球Token消耗量长期位居全球第六,占比约为4%-7%。这在国内位居前列,超过IDC统计中的其他厂商。阿里云在这里似乎排名又更高。
这种“矛盾”的成因是,阿里的通义千问、通义万相等都是开源模型。IDC无法统计到开源模型被使用的情况。OpenRouter主要覆盖通过聚合平台发生的调用Token,又难以统计云厂商自有MaaS平台内部、企业私有化部署、端侧推理以及真实总量。

因此,无论采用哪种单一统计口径,都无法反映市场真实全貌。这些方式,都会低估中国AI落地的真实情况。
国际市场调研机构Gartner在《2026年十大战略技术趋势》给了一个更全面的解释——2028年60%以上的企业级AI模型将采用特定领域模型(DSLM)(根据特定数据集训练的AI模型,准确性、合规性更高),它们可能同时通过云、本地、设备、MaaS部署。
某中国云厂一位资深人士对我们总结称,前沿开发者、AI创新企业、企业PMF验证阶段习惯通过MaaS平台调用API使用Token,这部分数据最容易统计。公共云租赁GPU部署更适合互联网或其他大型公司大规模部署阶段的需求。通过私有化或本地部署(On-premise)算力,则符合金融、政府等数据合规要求的机构。端侧算力,适合于汽车、机器人等低延时场景需求。后三种Token消耗都难以被统计。
在他看来,严格定义广义Token消耗量,要把MaaS平台、公共云GPU推理集群产生Token、私有化模型部署产生Token,设备端模型产生的Token全部统计在内。

在讨论Token的规模、增速与统计口径之前,一个更基础、却常被忽略的问题是:大型企业在采购AI云服务时,究竟是如何做决策的?
在多数企业的真实IT采购逻辑中,Token更多是AI应用投入运行后的成本指标,而非采购决策阶段被单独衡量的核心依据。因为,从企业CIO(首席信息官)、CTO(首席技术官)的视角来看,Token消耗量并不能直接和业务价值挂钩,更多是和成本挂钩。
Token本质上是模型调用的技术计量单位,它类似CPU使用率、GPU小时数。因此,无论是在互联网企业、制造业,还是金融、能源与公共部门,它们在引入AI能力时,真正衡量的首要业务价值是——能否提高收入,能否降低成本,能否缩短流程周期。
多位企业IT负责人曾对我们表示,CIO、CTO考量中的真实AI落地流程大致分成两阶段。
第一阶段是,Agent能否摆脱独立外挂,进入业务流程并与之深度融合。经过概念验证阶段的小规模试用后,Agent如何真正长期、稳定地参与业务运行。这要求模型能力,系统稳定性、延迟、可靠性,以及与既有IT架构的兼容性,都达到可控水平。在这一阶段,企业更关心“能不能用”“敢不敢用”,而不是“用了多少Token”。
在第二阶段,成本与效率逐渐浮出水面。只有当Agent已经被部署进具体业务场景,开始持续运行之后,他们会开始考量成本问题。其中包括云成本,还包括人力、外包、系统维护以及流程摩擦所带来的隐性成本。在企业的成本核算与优化体系中,模型调用频次、Token消耗量以及由此带来的算力成本是云账单的一部分。在这样的决策逻辑下,Token的角色更接近于运营指标,而非采购指标。
一位中国大型企业集团数字化部门技术人士对我们表示,他们最关注的,不是模型调用消耗了多少Token,而是Token带来了多少算力成本。因为AI应用的Token成本难以预测,不像过去是买断制、订阅制软件相对固定。
简而言之,Token消耗量更偏供给方(云厂商)视角,而非需求方(进行数字化转型的企业)视角。因为,企业感知AI价值的方式,更多体现在Agent等AI应用上——Agent才是承载业务逻辑,吞吐Token,直接参与业务流程的基本单元。
部分大型企业智能化转型中,甚至在用Agent定义“北极星指标”,如一岗一助手、一人一分身。它更关注Agent渗透率,AI业务渗透率等更加全面的指标。
Token很重要,但更重要的是,如何让Token在真实业务场景中,通过Agent转化为可衡量、可持续的业务价值。否则,这甚至可能会导致“负向激励”。
一位中国云厂商资深人士提到,如果过分以Token收入增长作为目标,可能会导致在实际工程中,更强、更成熟的模型往往能够以更少的Token完成同样的任务,而模型能力不足、系统尚未优化时,Token消耗反而可能更高。
上述中国云厂商大模型业务负责人2025年12月曾对我们表达了这样一个观点——中国数字化市场的需求、层次是复杂多样的。云厂商要从客户视角出发,而不是自己想卖什么,进而期望客户用什么。
Token对前沿开发者、AI创新企业的需求很重要,但他同时认为,中国数字化市场的真实结构是,头部互联网企业,金融、能源、交通等行业的央国企,制造、零售等领域的大型民营企业仍是中国IT支出的主力军。这是中国数字化转型的深水区。因此,应该尊重这部分客户的现实选择。
企业使用AI,最终目的还是用AI逐步替代、吞并、重构几项企业成本——人力成本、传统软件成本、部分外包与流程成本、旧IT架构中的低效环节。真正决定AI云长期增长空间的,是AI是否能够稳定进入更多业务流程,持续优化业务运营,改变企业IT结构。
在2025年12月末的这场沟通中,刘伟光的看法是,云计算到今天并没有改变本质,那就是为应用服务。只是承载的类型从传统应用扩展到了大模型或AI应用。重要的是,云计算技术栈要与时俱进。AI云不是简单的AI+云,而是云计算IaaS、PaaS、MaaS平台、Agent平台全栈深度融合。这样才能让企业客户高效部署AI应用。
“这十多年,中国云市场是全球竞争最激烈的,各种概念层出不穷,价格战也屡见不鲜。但如果用更长的周期去看未来,技术能力和技术布局的前瞻性永远是市场的胜负手,这终将被时间验证。”刘伟光说。
如果把目光放到中国企业未来5年-10年的数字化转型,AI云的竞争重点是系统工程能力——让更多企业客户能够门槛更低、更好地使用AI,才是关键所在。
