只卖Token不做大模型:3年亏损4.4亿的硅基流动,流血冲刺港交所
15 小时前 / 阅读约8分钟
来源:凤凰网
硅基流动作为AI算力中间商,营收暴增但毛利率转负至-24%,因算力成本高昂且面临大厂价格战。其用户量暴涨得益于DeepSeek狂欢,但留存面临考验,核心高管离职更添不确定性。

6月30日,一家定位为AI时代“卖水人”的初创公司北京硅基流动科技股份有限公司(下称“硅基流动”),正式向港交所递交上市申请。此时,距离这家于2023年8月注册成立的公司,还不到三年时间。

不到三年,七轮融资,从天使轮的2.8亿元估值,一路狂飙到B+轮的77.4亿元。它的背后,站着阿里巴巴、美团、华为哈勃、商汤、智谱、创新工场等一众令人眼花缭乱的产业巨头和顶级VC。

资本盛宴烈火烹油、繁花似锦。但翻开347页招股书,「数智研究社」发现,这是一家营收虽然暴增七倍,但毛利率却断崖式跌至-24.0%的公司。这是一家手握上千万注册用户、日均吞吐量高达几千亿次,却深陷“做得越多,亏得越惨”泥潭的算力中间商。

在巨头环伺、算力账单高企、API价格战刺刀见红的今天,硅基流动“流血冲刺”,是新一代基础设施霸主的加冕,还是在大厂围剿下不得不提前抢跑的大逃亡?

硅基流动不是一家大模型公司,也不直接开发面向C端的AI应用。它是一家“开放、独立的Token供应平台”,也就是所谓的“Token工厂”。

在AI世界里,无论写代码、画图还是做数据分析,大模型处理信息的原子单位就是Token(词元)。硅基流动的生意逻辑,就是把上游各种乱七八糟的异构算力(如英伟达的GPU,以及昇腾、沐曦、摩尔线程等国产芯片),和各种不同架构的AI模型整合在一起,通过自己研发的推理引擎和算力资源编排系统,打包成标准化、可计费的Token,像自来水一样卖给下游的开发者和企业。

在这个宏大叙事下,硅基流动交出了一份漂亮的流量成绩单。

招股书显示,截至2026年4月30日,硅基流动平台注册用户数已经突破了1028万。作为对比,2024年底注册用户数还仅只有12.7万。短短一年多时间,用户量暴涨了几十倍。

在代表业务活跃度的日均Token吞吐量上,2026年4月达到5785亿次,单日最高峰值甚至突破1.0714万亿次。以弗若斯特沙利文数据计,按2025年词元年吞吐量计算,它已经成为中国最大的独立生态词元供应商。

如此恐怖的流量爆发,很大程度上要归功于年初轰动全球的DeepSeek狂欢。

2025年初,DeepSeek V3和R1模型火爆出圈,官方服务器被庞大的访问量挤爆。就在千万用户无处尝鲜的绝佳窗口期,硅基流动凭借其在国产芯片适配上的技术积累,迅速联合华为云上线了满血版服务,一举承接了海啸般的溢出流量。配合着“注册送14元、邀请再送14元”的裂变拉新玩法,硅基流动一夜间名声大噪,网站访问量飙升近40倍。

泼天的富贵,直接把硅基流动的营收推上了天。2025年公司实现收入5533万元,较2024年的734.6万元同比暴增653.2%。这其中,公有云服务(包括无服务器词元服务和专属实例)立下汗马功劳,收入占比达到52.9%,反超了传统的本地部署业务。

故事讲到这里,看起来是一个完美的AI创投范本。但商业世界的残酷是,命运馈赠的所有礼物,早就在暗中标好了价格。

当大批小白用户和开发者涌入平台疯狂消耗Token时,硅基流动的后台也在承受着失控的成本反噬。

卖Token,从来就不是一门稳赚不赔的生意。2024年,公司规模还不大时,毛利率维持在39.4%的体面水平。但到营收大爆发的2025年,随着公有云业务的快速扩张,公司销售成本从前一年的445.2万元飙升到6863.2万元,反超了全年总收入。

这样一来,2025年硅基流动的毛利率直接转负,暴跌至-24%,单在毛利层面就亏掉了1330.2万元。其中,公有云服务的毛利率更是扩大到-119%。

为什么会这样?

答案很简单:算力太贵了。

作为一家中间商,硅基流动自己并不生产芯片,它的算力资源严重依赖向上游云厂商和算力中心租赁。为了承接瞬间涌入的海量用户请求,保证服务稳定性,它必须提前租赁并囤积大量算力。

然而,这些昂贵算力资源的利用率仍处于爬坡阶段,规模效应根本没有跑出来。换句话说,公司花高价租来了服务器,却在用极低的价格甚至是通过送代金券免费倒贴,把Token卖给用户。

在这种赔本赚吆喝的模式下,亏损自然如同滚雪球般迅速扩大。2023年至2025年,公司净亏损分别为1222.3万元、8191.5万元和3.45亿元。剔除股份薪酬等影响后,2025年经调整净亏损依然高达1.87亿元,经营现金流出1.72亿元,平均每个月都要烧掉1480万元的现金。

如果仅仅是短期的战略性亏损,资本或许还有耐心等待规模效应的到来。

但硅基流动头顶上真正致命的麻烦,是整个AI Infra(人工智能基础设施)赛道正在发生剧烈的模式切换。

硅基流动赚的是“算力与模型之间”的差价。行业早期,大厂的底层算力生态割裂,开源模型层出不穷,确实需要一个技术过硬的“中间商”来做跨芯片的适配和推理优化。

硅基流动创始人袁进辉,作为清华张钹院士的高徒、前OneFlow(一流科技)掌舵人,在系统软件和分布式框架上有着深厚积淀。2026年6月,硅基流动还正式收购了OneFlow的知识产权组合,进一步强化了底层的推理架构能力。

然而,随着AI行业迅速成熟,这条曾经的护城河被巨头们快速填平了。如今的牌桌上,阿里、腾讯、百度、字节跳动等互联网大厂,哪一个没有组建百人甚至千人规模的顶尖Infra团队?

阿里云成立了专门的Token Foundry事业部,由集团CEO吴泳铭亲自挂帅,把Token生产拉到了集团战略级高度。字节跳动的Seed-Infrastructures团队和火山引擎深度融合,将大模型的训练与推理框架一手包办。就连底层的芯片厂商摩尔线程、沐曦股份等,也开始越过中间商,直接与大模型公司进行深度绑定。

在巨头们“上挤下压”中,独立的AI Infra创业公司定位变得极其尴尬。

更要命的是,大厂们为了争夺开发者生态,疯狂发动API价格战。自2023年以来,头部厂商已累计十余次下调定价,部分主流模型每千Token的价格降幅甚至超过90%。2026年5月,DeepSeek官宣V4-Pro永久降价75%,腾讯云迅速跟进,最高降幅达到97.5%。

对于那些有自有云生态、能靠其他业务补贴算力的大厂来说,降价是抢占地盘的战略。但对纯靠算力差价盈利、本就毛利率为负的硅基流动来说,这无异于釜底抽薪。

在残酷的价格战和体验落差下,硅基流动此前靠烧钱和热点拉来的用户,忠诚度薄如蝉翼。有媒体和用户实测反馈,硅基流动平台调用的某些模型存在严重的数据幻觉和稳定性问题,甚至在回答简单商业问题时肆意编造数据,多模态能力也远逊于主流竞品。随着大厂官方渠道扩容,大量C端用户迅速回流,硅基流动的留存面临严峻考验。

内部动荡更是让这种焦虑雪上加霜。在2024年下半年火线加入、主导硅基流动这波泼天流量增长的核心高管联合创始人兼增长业务副总裁杨攀,在近期悄然离职,正筹划新的创业项目。在冲刺上市的敏感期,一员身经百战的大将突然挂印而去,无论对外如何粉饰,都不可避免地让外界对公司未来的商业化打上一个问号。