欧洲今年AI赛道最大的融资出现了。
近日,伦敦人工智能公司Synthesia宣布完成2亿美元E轮融资,估值达40亿美元。
与多数追逐通用大模型的初创公司不同,Synthesia专注企业级AI视频生成,帮助全球组织将文本知识高效转化为多语言培训与沟通视频。
从早期被近百家风投拒绝,到如今成为欧洲AI应用层的标杆,Synthesia的路径印证了一个趋势:在AI狂热中,真正赢得市场的,不是最炫的技术,而是最深的场景扎根。
2026年初,欧洲AI赛道迎来一个标志性时刻:总部位于伦敦的AI视频公司Synthesia宣布完成2亿美元融资,投后估值高达40亿美元。这不仅是欧洲生成式人工智能领域有史以来单轮金额最大的融资,更让Synthesia一举超越多数同行,成为该地区最值钱的AI应用层独角兽之一。
本轮融资的领投方是Alphabet旗下的GV(谷歌风投),跟投方包括英伟达的NVentures、Accel、NEA、Kleiner Perkins等一线机构。但比融资数字更值得关注的,是Synthesia如何在短短几年内,从一个被质疑“像做假新闻工具”的边缘项目,蜕变为服务超过半数全球100强企业的基础设施级平台。其核心答案,藏在一个看似枯燥却极具商业价值的场景里:企业员工培训。
在全球大型企业中,知识资产长期以文字形式沉淀——操作手册、合规指南、产品文档、安全规程。这些内容专业、准确,却往往枯燥难读,员工参与度低、转化率差。据麦肯锡研究,企业每年在培训内容制作上的平均支出超过200万美元,但其中超过60%的文字材料从未被有效转化为可传播、可理解的形式,沦为“知识废料”。
Synthesia的切入点正是于此。它利用自研的生成式AI技术,将一段文本自动转化为一段由“数字人”主讲的高质量视频。Synthesia产品操作非常简单,他们有大量现成的PPT模板,你只需要把内容填进去,AI形象会自动对口型、配合动作,精确到每一页都可以二次编辑。最后生成的就是一个标准的企业培训视频,画面专业、节奏稳定、可以批量生产。
换句话说,Synthesia的核心价值在于帮助企业将已有的文本类知识资产——如操作手册、合规指南或培训材料——高效转化为视频形式。对于跨国企业而言,传统视频制作流程复杂,涉及脚本、配音、拍摄与后期,且每增加一种语言往往意味着重复投入。而Synthesia允许用户通过输入文本,在短时间内生成由数字人主讲的多语言视频,大幅简化内容生产链条。
根据公司官网披露的信息,其客户包括可口可乐、辉瑞、埃森哲、摩根大通、联合利华和西门子等全球性企业。这些客户主要将平台用于内部场景,如员工入职培训、产品知识传递和合规宣导,而非对外营销。这种聚焦企业内部沟通的定位,使Synthesia避开了C端AI应用的激烈竞争,转而深耕高门槛、高留存的市场。
正是这种对企业决策逻辑的理解,让Synthesia在生成式AI热潮中走出了一条差异化路径:不追求通用内容生成,而是嵌入企业既有的知识管理与学习发展流程,成为提升信息转化效率的基础设施。
2017年,伦敦一间狭小的共享办公室里,Victor Riparbelli和几位来自剑桥与伦敦大学学院的博士正反复调试一段视频。画面中,一个虚拟人物正在用流利的英语讲解一段技术文档。这看起来像是一次普通的AI实验,却成了Synthesia创业故事的起点。当时没人想到,这个被近百家风投拒之门外的项目,会在不到十年内成长为估值40亿美元的欧洲AI独角兽。
创业初期的Synthesia,方向并不清晰。团队最初设想打造一个面向消费者的数字人平台,用户可以创建自己的虚拟分身用于社交或娱乐。然而市场反应冷淡。更棘手的是,他们的技术常被外界与“深度伪造”联系在一起。在一次早期路演中,一位投资人直接打断演示,质问道:“你们是不是打算做假新闻?”类似质疑屡见不鲜。彼时正值全球对虚假信息高度敏感的时期,任何涉及人脸合成的技术都容易被贴上伦理风险的标签。
整整两年时间,Synthesia几乎无人问津。创始团队向99家投资机构发出过融资请求,得到的回复不是婉拒,就是沉默。有投资人坦言,B2B的AI视频听起来太遥远,企业根本不会为这种“花哨功能”买单。还有人认为,视频制作本就是低频需求,难以支撑一个SaaS产品的长期增长。最艰难的时候,团队靠兼职咨询维持运转,办公室租金都需分期支付。
联合创始人Steffen Tjerrild在绝望中,给美国亿万富翁、NBA达拉斯独行侠老板Mark Cuban发了一封邮件。有意思的是,这个邮箱地址是从几年前索尼被黑客攻击泄露的数据库里找到的。
Mark Cuban 5分钟内就回复了。接下来是一场持续14个小时的邮件往返——Cuban不打电话,所有沟通都靠邮件——到英国时间凌晨4点,Cuban同意投资100万美元。
这笔钱让Synthesia活了下来,也验证了创始团队后来反复强调的一个观点:最好的投资人是那些本来就认同你愿景的人。与其浪费时间去说服怀疑者,不如找到那些已经相信这个方向的人,然后让他们评估你是否是执行这件事的合适人选。
2020年,疫情加速了远程办公和数字化培训的需求。Synthesia的客户名单开始出现埃森哲、辉瑞、联合利华等名字。这些企业发现,用AI视频替代部分真人录制内容,不仅节省开支,还能显著提升员工学习完成率。一位制药公司培训负责人曾表示,过去合规课程的平均完成率不足40%,引入Synthesia后跃升至85%以上。
资本市场的态度也随之逆转。2021年,Google母公司Alphabet旗下的GV领投A轮融资;2023年,Kleiner Perkins加入B轮;到2026年C轮,Accel等顶级机构争相入场。曾经被质疑“太早”的技术,如今被视为企业AI落地的典范。
回望那段被拒绝99次的日子,Synthesia的创始团队坦言,最大的教训不是技术不够好,而是没有找准价值锚点。当他们从“能做什么”转向“企业真正需要什么”,一切才开始顺畅起来。AI视频在消费端或许只是新奇玩具,但在企业内部,它解决了知识传递效率低下这一长期顽疾。
更关键的是,他们避开了红海竞争。当无数初创公司扎堆做AI聊天机器人、图像生成或短视频滤镜时,Synthesia默默深耕一个看似枯燥的垂直领域。正是这种“冷门”选择,构筑了高壁垒:企业客户看重安全性、稳定性与集成能力,而非界面是否炫酷。这也解释了为何后来者即便技术相似,也难以撼动其先发优势。
Synthesia估值达到40亿美元,不仅是一家公司的胜利,更标志着一个新产业拐点的到来。
过去几年,生成式人工智能从实验室走向商业应用,而视频——这一信息密度最高、情感传递最丰富的媒介——正成为AI落地企业场景的关键载体。与图像生成或文本创作不同,AI视频的价值不在于“炫技”,而在于解决企业运营中长期存在的结构性难题:知识沉淀难以激活、内容生产效率低下、全球化沟通成本高昂。如今,这些问题正被一套全新的技术范式系统性破解。
企业对视频的需求早已超越营销宣传。在内部运营中,视频已成为培训、合规、客户服务、产品发布等核心流程的刚需。然而传统视频制作依赖专业团队,周期动辄数周,成本动辄数万,且难以本地化适配。麦肯锡一项调研显示,全球500强企业平均每年制作超过500小时的内部视频内容,但其中70%以上仅使用一次便沉睡在服务器中,无法复用、无法更新、无法追踪效果。这种“一次性内容”的浪费,正是AI视频要解决的根本问题。
AI视频平台的核心能力,在于将静态知识资产转化为动态、可交互、可规模化的内容单元。用户只需输入一段文字脚本,系统即可自动生成由数字人主讲的视频,支持120种以上语言,口型与语音高度同步,表情自然流畅。更重要的是,这些视频并非孤立存在,而是可嵌入企业现有工作流。例如,当HR系统新增一名员工,AI可自动触发生成包含岗位介绍、安全须知、文化导览的个性化入职视频;当产品文档更新,相关培训视频同步刷新,确保全员信息一致。这种“数据驱动内容生成”的模式,让视频从“成品”变为“服务”,真正融入企业数字神经系统。
目前,AI视频的应用场景正在快速扩展。在金融行业,银行用它生成反洗钱合规培训,确保全球分支机构统一执行监管要求;在制药领域,药企通过多语言AI视频向医生精准传递新药信息,避免人工翻译误差;在制造业,工厂将操作规程转化为AR叠加的指导视频,工人佩戴眼镜即可看到虚拟导师演示设备维修步骤。据Gartner预测,到2026年底,30%的大型企业将部署AI生成视频用于内部沟通,这一比例在2023年还不足5%。市场研究机构CB Insights则估算,企业级AI视频市场规模将在2028年突破500亿美元。
竞争格局也在加速演变。当前市场参与者大致分为三类。第一类是垂直型SaaS公司,专注B2B场景,强调安全性、集成能力和企业级服务。这类公司客户集中于世界500强,客单价高,续费率强,但销售周期长,需深度对接IT架构。
第二类是轻量化工具平台,面向中小企业或个人创作者,提供自助式视频生成,价格亲民但功能有限,难以满足复杂合规需求。
不过,巨头全面入场仍需时间。企业级AI视频并非简单拼接语音与图像,而是涉及身份授权、内容审计、数据隔离、多系统集成等复杂工程。Synthesia之所以能率先赢得头部客户,正是因为它在早期就投入大量资源构建合规体系,获得SOC 2 Type II、ISO 27001等认证,并支持私有化部署。这些能力短期内难以被复制,构成了坚实的护城河。
从全球视角看,欧洲在AI应用层正走出一条差异化路径。不同于美国聚焦大模型基础研发,也不同于中国侧重C端流量变现,欧洲企业更倾向于在高价值、高合规的B2B场景中深耕。Synthesia、德国的Deepse、法国的Mistral等公司,虽规模不及硅谷巨头,却在细分领域建立了不可替代性。这种“专精特新”式的创新,或许正是欧洲在全球AI竞赛中突围的关键。
展望未来,AI视频的演进方向清晰可见。首先是智能化升级。当前系统仍需人工输入脚本,下一步将实现从企业知识库自动提取信息、生成结构化内容。例如,AI可扫描CRM中的客户画像,自动生成个性化的销售提案视频。其次是交互化延伸。静态视频将逐步过渡到实时对话式数字人,员工可随时提问,系统即时回答并调取相关视频片段。最后是生态化整合。AI视频平台将不再独立存在,而是作为模块嵌入HR、LMS、CRM等主流企业软件,成为像邮件、日历一样的基础设施。
当然,挑战依然存在。伦理风险始终是悬顶之剑。尽管Synthesia严格限制数字人使用需经本人授权,并为每段视频添加不可见水印,但deepfake技术的滥用阴影从未散去。此外,数字人的情感表达仍有局限,在需要高度共情的场景(如危机沟通、高管致辞)中,真人出镜仍不可替代。这些边界决定了AI视频不会完全取代人类,而是作为增强工具,释放人的创造力。
Synthesia的故事,本质上是一场关于“效率”与“人性化”的再平衡。它没有追求通用人工智能的宏大叙事,而是选择在一个具体痛点上做到极致——让知识流动起来,让沟通更高效,让全球员工无论身处何地,都能获得一致、清晰、可理解的信息。这或许正是AI商业化的正道:不为技术而技术,而为解决真实世界的问题。
