大模型推理的基石 vLLM,现在成为创业公司了。
北京时间周五凌晨传来消息,由开源软件 vLLM 的创建者创立的人工智能初创公司 Inferact 正式成立,其在种子轮融资中筹集了 1.5 亿美元(约合 10 亿元人民币),公司估值达到 8 亿美元。

本轮融资由风险投资公司 Andreessen Horowitz(a16z)和 Lightspeed 领投,Sequoia Capital、Altimeter Capital、Redpoint Ventures 和 ZhenFund 也参与了投资。
Inferact 的 1.5 亿美元天使轮融资虽不及 Ilya Sutskever 的公司 SSI 的 10 亿美元,但已经超过了 Mistral AI 的 1.15 亿美元,是有史以来规模最大的种子轮融资之一,标志着业界对于 AI 推理基础设施的重视程度正在急速提升。
Inferact 的使命是将 vLLM 发展成为世界领先的 AI 推理引擎,并通过降低推理成本、加快推理速度来加速 AI 的发展。
该公司认为,AI 行业未来面临的最大挑战不是构建新模型,而是如何以低成本、高可靠性地运行现有模型。
毫无疑问,Inferact 的核心是开源项目 vLLM,这是一个于 2023 年启动的开源项目,旨在帮助企业在数据中心硬件上高效运行 AI 模型。

vLLM 最初由加州大学伯克利分校(UC Berkeley)的天空计算实验室 (Sky Computing Lab) 开发,现由 PyTorch 基金会负责管理,已吸引了来自整个 AI 行业的 2000 多名贡献者,是全球范围内最受欢迎的开源大模型推理加速框架。
如今,vLLM 的推理能力在为 Meta、谷歌、Character.AI 等科技公司提供支持。
Inferact 的首席执行官 Simon Mo 是一位伯克利在读博士生,他是 vLLM 的创始维护者之一。Mo 表示,公司成立于 2025 年 11 月,并于本周正式对外公布。他将 Inferact 的起源与伯克利早期的一些软件项目进行了比较,这些项目后来发展成为规模更大的企业,例如 Apache Spark 和 Ray。

在宣布融资的同时,Lightspeed(光速创投)也发布了对 Simon Mo 的访谈。在其中 Simon Mo 谈到了对于全球 AI 算力紧缺的担忧,「当前用于大模型训练的 AI 集群,将在六个月内完全被用于推理…… 推理会逐渐消耗掉所有算力容量,并耗尽所有新增的容量。」
在公告中,Inferact 表示,其定位于模型和硬件的交汇点:当模型厂商发布新架构时,他们会与 vLLM 合作,确保提供首日支持;当硬件厂商开发新芯片时,他们会与 vLLM 集成;当大模型团队进行大规模部署时,他们会运行 vLLM,从前沿实验室到超大规模数据中心,再到服务数百万用户的初创公司,无一例外。
如今,vLLM 支持了 500 多种模型架构,可在 200 多种加速器上运行,并支持着全球规模的推理。这个由 2000 多位贡献者共同构建的生态系统,是 Inferact 得以成立的基础。
Inferact 表示,其首要任务是继续支持 vLLM 作为独立的开源项目,并将改进成果分享给社区。他们计划进一步提升 vLLM 的性能,深化对新兴模型架构的支持,并扩大对前沿硬件的覆盖范围。Inferact 的第二个目标是开发一款独立的商业产品,帮助企业在不同类型的硬件上更高效地运行 AI 模型。
值得关注的是,vLLM 项目的核心贡献者清华博士游凯超成为了这家公司的联合创始人。

据介绍,Inferact 的创始团队包括 Simon Mo、Woosuk Kwon、Kaichao You(游凯超)、Roger Wang、Joseph Gonzalez、Ion Stoica 等人。
https://inferact.ai/
https://www.bloomberg.com/news/articles/2026-01-22/andreessen-backed-inferact-raises-150-million-in-seed-round
