硅基流动IPO,Token工厂不好做
6 小时前 / 阅读约12分钟
来源:36kr
硅基流动向港交所递表,定位AI时代“Token工厂”,通过自研引擎调度芯片供模型使用。其公有云业务亏损,本地部署盈利。面临高研发投入、成本结构等问题,77亿估值赌时间差。

6月30日,硅基流动向港交所递表。这家仅成立35个月的公司,讲出的故事是,做AI时代的“Token工厂”。 

什么叫Token工厂?简单来说,它不自己造大模型,也不做应用,而是卡在中间,把英伟达、华为昇腾、壁仞、沐曦、摩尔线程等不同厂商的芯片,通过自研引擎SiliconLLM统一调度,让DeepSeek、Qwen、Kimi、MiniMax等模型跑起来,按Token量卖给开发者和企业。 

招股书显示,根据弗若斯特沙利文(Frost&Sullivan)的数据,按2025年的词元年吞吐量计算,其位居“中国独立生态词元供应第一”。 

但这个“第一”仅限于独立第三方MaaS厂商,如果把阿里、腾讯、字节、华为等大厂自家的MaaS也纳入统计,硅基流动在整个市场中仅以1.5%的份额排在第四位,前三名分别是火山引擎、阿里云、百度智能云。 

硅基流动的股东名单堪称豪华,阿里、华为哈勃、美团、创新工场、商汤等均位列其中, 其 今年6月完成B+轮融资后 估值达到77亿 元,对应2025年营收的PS高达140倍。 

但招股书里的账本,是两组反差极大的数字。一组是增长,2025年营收5533万元,同比增长653.2%,付费客户从2454家飙升至71.6万家;另一组是亏损,2025年净亏损3.45亿元,是2024年的4倍,毛利率更是从2024年的39.4%降到-24%。换算下来,它每收入1元钱,要倒贴0.24元。 

77亿元估值、140倍PS,硅基流动是不是被高估了?只卖Token,能不能撑起一门生意? 

01 两大业务,一个亏钱、一个赚钱

硅基流动的故事,得从两件事说起。 

一是创始人袁进辉。他是AI Infra(AI基础设施)圈里少有的技术出身的连续创业者,清华博士,师从张钹院士,毕业后进入微软亚洲研究院。2016年从微软离职后,他创立了OneFlow(一流科技),做深度学习训练框架。这个项目最终在2023年被王慧文的光年之外收购,后因王慧文病休并入美团。同年8月,袁进辉带着OneFlow的核心人马二次创业,转向AI推理Infra,硅基流动就此登场。 

二是2025年春节的一次爆红。硅基流动联手华为云昇腾,在DeepSeek R1火起来的当口,首发国产化部署方案,一夜出圈,成为第一批接住DeepSeek流量的底层基础设施企业。袁进辉当时在朋友圈感叹“需求量太大了”,超出团队预期,并在上线仅10个小时就宣布限流。这场爆红是硅基流动拿到“独立第一”名号的关键一战。 

根据招股书,硅基流动有两条业务线,但命运截然不同。 

第一条是公有云服务,也就是市场所说的MaaS,这是硅基流动Token工厂定位最直接的体现。简单说就是租用GPU、封装模型API、按Token收费。2025年,这条线为硅基流动贡献了2926万元营收,占总收入的52.9%。 

图源 / 硅基流动微信公众号 

运营数据同样亮眼,日均词元吞吐量达5785亿次,单日峰值突破1万亿;累计服务超过1000万用户、1万家企业客户;付费客户数从2454家飙升至71.6万家,增长了289倍。过去一年,API调用量也从每月数十亿次提升到数千亿次。 

但问题是,账算不过来。这条业务的毛利率为-119%,相当于每收入1块钱,硅基流动还得倒贴1.19元。 

第二条是本地部署解决方案,即客户自备算力,硅基流动将SiliconLLM引擎和算力编排系统部署到客户数据中心,从而收取软件许可费、实施费和维保费。2025年,这项业务营收2607万元,占总收入47.1%,毛利率高达82.5%。 

这条线看起来是利润奶牛,但招股书里藏着两个信号值得留意。 

一是客户集中度上升。本地部署客户数量从2024年的28家减少到2025年的20家,减少了28.6%,但平均每名客户收益从22.4万元大幅增至130.3万元,涨幅481.4%。这意味着,该业务正从走量转向做大单,收入越来越依赖少数高合约价值的大客户。一旦某个大客户流失或缩减预算,收入波动会被放大。 

二是规模化的天花板。本地部署本质上是项目制生意,每个客户的部署环境、算力配置、模型需求都不一样,交付周期长、复用率有限。硅基流动虽然靠SiliconLLM引擎试图把这个部署过程标准化,但真正想实现规模化,门槛还很高。 

两条业务线营收几乎各占一半,一个亏钱,一个赚钱。 

更值得注意的是,收入结构的变化。2024年,本地部署收入627.7万元,公有云收入仅106.9万元,本地部署是绝对主力。到了2025年,公有云收入反超至2926万元,本地部署收入2607万元,两者才趋于平衡。也就是说,硅基流动的“Token工厂”故事,主要是2025年这一年讲出来的,时间窗口很短。

而2025年的亏损扩大,也主要发生在公有云业务快速扩张的过程中。销售成本从2024年的445.2万元暴增至2025年的6863万元,涨幅超过14倍,远超收入6.5倍的增速。成本的扩展,直接把毛利率从正的39.4%拉成了-24%。 

这正是硅基流动的尴尬所在,它必须继续把MaaS这条亏钱的线做大,才能撑起“Token工厂”的估值故事,但每做大一分,亏损就扩大一分。想象力和现金流,硅基流动短期内只能选一个。 

02 Token工厂为什么难赚钱?

为什么MaaS业务明明收入增长迅猛,却越卖越亏?答案藏在成本结构里。 

首先是高研发投入摊薄了本就微薄的收入。 硅基流动2025年研发费用为2.09亿元,占到了总营收378%。 招股书显示,这笔钱主要投向引擎迭代、国产芯片适配。 

看上去都是应该花的钱,也符合AI行业重研发的特征,但问题在于,全年收入才5533万元,研发支出几乎是收入的四倍,研发增速也跑赢了收入增速。 

另外,在MaaS的成本结构中,租卡是固定成本,Token产量却是变量。 

招股书显示,硅基流动2025年 6863万的销售成本中,算力租赁接近6000万元,占比高达87%。 这主要是为了承接推理需求的爆发,提前锁定了英伟达、昇腾、壁仞、沐曦、摩尔线程等多品牌GPU。 

SiliconLLM虽然能把单张显卡的处理效率提升,也用上了缓存复用、任务拆分、预测解码等技术,可客户的调用量一旦未能跟上,租卡费又是固定的,单位成本反而被拉高。 

为了填满产能,硅基流动选择烧钱换客户,打法是先靠免费代金券拉规模,2025年向免费用户发放的代金券对应算力成本高达5400多万元,全部计入销售费用,不产生收入,再试图将这批用户里的一部分转化成付费用户。 

结果确实明显,付费客户从2454家增长到71.6万家,涨了289倍。但代金券烧出来的量,能不能持续转化成活跃调用、把空转的卡填满,仍是问号。这70多万的付费客户里,持续活跃的比例有多少,招股书也没有披露。但从整个行业的发展现状来看,MaaS的免费用户留存率和付费转化率普遍偏低,这不是硅基流动一家的问题,而是整个赛道都在面临的困境。 

但这些账面上的问题,还只是表象。更深一层的问题,是硅基流动作为“独立第三方MaaS厂商”的位置本身,在AI Infra格局里存在着一定劣势。

一方面是生态位。火山方舟、阿里百炼、百度千帆的打法一致:自研模型+云生态打包卖,MaaS本身可以亏,靠云存储、数据库、老客户合同交叉补贴。可硅基流动没有生态可以交叉补贴,它的代金券更接近于纯成本。烧出去的钱,很难靠其他业务赚回来。 

另一方面是供应链受限。向上,硅基流动是纯粹的租卡方。招股书显示,阿里和华为哈勃在2025年分别向硅基流动供应1970万元和1262万元算力,阿里占采购额11.9%,华为占7.6%,两家合计近20%,与此同时,阿里百炼、华为云MaaS又是硅基在公有云MaaS市场的直接竞对。这意味着,硅基烧钱换量的租卡成本,有一部分直接流进了竞对的口袋。向下,硅基流动没有自研模型,只能接开源模型,同样对外部依赖。 

03 77亿估值,买的是什么?

硅基流动现在的打法较为清晰:用MaaS拉估值,用本地部署养毛利。 

但MaaS才是估值的核心。要理解这一点,先看两个海外同类型公司。 

Fireworks AI估值40亿美元,年化ARR约2.8亿美元,Together AI估值33亿美元,行业估算其ARR在1.5-2亿美元,两家的PS都在30-50倍,它们的估值逻辑都是, MaaS是流量入口,等客户规模做大、形成平台依赖后,再引导它们升级到私有部署或企业级服务。

而硅基流动77亿元估值、140倍PS,比海外同类玩家贵了3-4倍。这个溢价,市场是在赌两件事。 

第一是国产芯片缺一个通用中间层。

昇腾、壁仞、沐曦、摩尔线程这几家国产AI芯片主力出货量涨得很快,但每家的软件接口、编译器、驱动都不一样,大厂云通常只深度适配自家芯片,模型厂要是想跑多个品牌的芯片,就得挨个对接,成本高、周期长。 

硅基流动的SiliconLLM引擎,想做的就是这个通用中间层,如果这套东西能跑通,硅基流动的价值就不止是一家MaaS公司,而是切进了国产算力生态的核心环节,这是估值溢价里最有想象空间的部分。 

但风险在于,国产芯片厂商也可能自己补齐这一层。比如,昇腾、壁仞一旦未来推出成熟的统一软件栈,硅基的中间层价值很可能会被直接替代。 

第二是中立本身的溢价力。

大模型厂商不愿把自身推理放在有自研模型的大厂云上,担心调用数据被拿去训练竞品。硅基流动的模型中立策略,恰好解决了这个顾虑。 

但这同样面临两个疑问。 

其一是缺乏定价权。没有自研模型,意味着没有模型即流量的入口效应,只能被动接受开源模型的价格带;没有自研芯片,同样失去了芯片即成本的定价权。硅基流动能收多少钱,基本上取决于开源模型的价格战节奏,自己没有控制力。开源模型的官方API定得越低,硅基流动的定价空间就越窄。 

图源 / pexels 

其二,一旦国产芯片厂商或某个模型方推出足够便宜、好用的官方MaaS,客户完全可以直接对接,“中立第三方”这个价值就会被绕开。 

这一点,硅基流动的股东名单也能说明问题。它的股东阵容就像是一张围绕“Token生产”展开的产业链地图,涵盖算力和芯片方,模型和应用方,以及云和产业资本方。其中有些既是它的股东,又同时是它的供应商和竞对,如果自家的MaaS业务跑出来了,那是主营业务的胜利;如果独立中间层这个物种真的能跑通,那就通过股权分一杯羹。 

硅基流动当下140倍PS的估值,本质上押的是时间差,即在国产芯片自研软件方案成熟、在竞争对手补齐中立能力之前,它能不能先把位置占住。 

但时间差是有期限的。 招股书没有给出具体盈利时间表,截至2025年末,其账面现金及等价物为1.72亿元,再加上今年B轮融资的超20亿元,其 家底还比较厚。 硅基流动的IPO, 赌的就是在时间差耗尽之前,把MaaS的利用率提上来,让Token工厂真正转起来。