今天(2026年3月5日),吴泳铭发出了一封内部信。
两件事:一,公司批准林俊旸离职;二,阿里将继续坚持开源模型策略。
两件事同时出现在同一封信里,没有人觉得奇怪;但这恰好是一个很值得追问的时刻,你要坚持的那条路,和刚刚送走的那个人,是同一件事的两面。
林俊旸走的前一天,技术圈里的反应几乎立刻就来了。
大家表面上聊他一个人的职场得失,其实,每个人都在这件事里看到了自己,还看到了一个藏得深但很尖锐的问题:阿里的开源策略,是不是要变了?
这个反应本身是一个信号。
一个人和一家公司的某条战略路线绑得这么深,在大公司里其实很少见。他能做到这一点,因为他在公司之外,靠技术社区攒下了真正的影响力,那种影响力属于整个开发者社区。
Google、Anthropic都有这样的人。
他们都很高调,经常出现在产品发布和播客里,没人觉得这有问题。这些公司反而把他们当成资产来运营,因为一个能打动开发者的技术大牛,才是开源生态能真正转起来的关键。
阿里有了林俊旸,然后,他离开了。
据 X 上流传的通义沟通会现场纪要,周靖人在台上说,自己「也是被架空的」。这句话本该出现在稳定军心的场合,却偏偏被爆了出来,足以说明阿里内部的复杂程度,远不是一封措辞平稳的内部信能装下的。
所以,这件事是一个组织在面对某类问题时的集中暴露:
从公司内部成长起来的超级个体,影响力超出了自己的岗位边界,这家公司会怎么应对?这个问题,比开源还是闭源更根本,也比股价涨涨跌跌更影响长远。
吴泳铭重申了开源策略。
放在这个时间点,它是一个需要被追问的表态;开源,在过去几年成为中国模型厂商竞争的标配动作,但开源这两个字背后,藏着两种完全不同的逻辑。
第一种,真的信开源。
建一个有影响力的开发者社区,让模型在社区里被大家用、被改造、被延伸,最后形成一个不依赖某一家公司的生态,这条路走得慢,一旦走通了,护城河会特别深。
Qwen能有望取代Llama在全球开源社区的地位,走的就是这条路。
第二种是开源作为竞争工具。
我的开源已经逼近闭源,这个叙事在融资、在舆论、在对抗头部玩家时都有用,它本质上是市值管理和品牌策略,开源是手段。
这两种逻辑,顺境的时候能凑在一起走,可一旦商业化的压力上来了,两者之间的裂缝就会越拉越大。在智远看来,阿里从来没有真正想清楚自己要是哪一种。
2025年初,裂缝被一个外部变量撕开了。1月,DeepSeek发布R1模型,MIT授权,训练成本557万美元。
一个规模还不到Qwen团队零头的小团队,用不到十分之一的成本,做出了一个全球开发者都抢着下载的模型;这就证明了一件事:走开源这条路,资源多、规模大不算护城河,效率才是。
对阿里来说,当时Qwen团队有100多号人,要支撑从0.5B到110B的几十款模型,还要做预训练、后训练、多模态、Agent工具链,摊子铺得特别大。
DeepSeek一出来,阿里内部的焦虑感就开始蔓延,管理层问得最多的一句话:为啥我们这么多人,做出来的东西,跟一个几十人的小团队比,拉不开差距?
这个问题没有标准答案,但它带来了一个连锁反应。
Qwen团队原来的训练节奏被打乱了,那种先做小尺寸模型验证、再推大尺寸的流程,被认为太慢;算力资源开始向旗舰模型倾斜,团队自己的自主权也越来越小。
开源需要长期的耐心,商业化要的是快速响应,顺境里能两头兼顾,逆风的时候,就只能二选一。
咱们看一组有意思的对比:
MiniMax和智谱没搞大规模开源,估值照样涨上去了;字节更彻底,干脆不开源,Seedance直接按秒收费,一秒一块钱,照样有人愿意付。
再看阿里,为了抢入口、做生态,花了不少钱,可股价怎么样,我不敢随便下结论。
这里有个有点扎心的问题:二级市场在用钱投票,投的是你到底清楚自己在用开源换什么。
MiniMax和智谱清楚,字节清楚,可阿里的问题在于,它既想拿开源信仰的好处,又想占开源工具的便宜,却没想明白,这两种逻辑在资源分配上根本是冲突的。
据Qwen的研究员说,团队之前一直有自己的训练节奏,先小尺寸验证再推大尺寸,对算力的需求是周期性的;可当整体竞争压力改变了训练策略,算力资源的分配变成了内部博弈的筹码,原来的节奏就彻底乱了。
很多人形容林俊旸,是「没什么自带的师承派别、也没有庞大关系网」的技术leader。在大厂体系里,是个异类。
大厂的晋升逻辑,本来就偏向有根系的人,有师承、有派系,能让组织看到你的忠诚。
可林俊旸的成长路径根本不符合这套逻辑,他的影响力来自社区,来自开发者,来自公司边界之外;这既是他最大的价值,也是他最后被边缘化的根本原因。
一个组织能长出超级个体,不代表他知道怎么跟超级个体相处;这两者之间的鸿沟,在2025年夏天变成了一道裂缝;裂缝的起点,是一场关于「模型该怎么搞」的争论。
林俊旸信奉「垂直整合」。
他觉得预训练、后训练、Infra、多模态应该深度配合,一个团队从头跟到尾,这样才能快速迭代、及时发现问题。
Qwen能在两年内从0做到全球下载量第一,靠的就是这套方法,小尺寸模型发现问题,大尺寸立刻修正;训练时遇到Infra的瓶颈,负责Infra的人就在旁边,当场就能调整。
周靖人带来了另一种逻辑:水平分工。
把团队拆成预训练、后训练、文本、多模态几个独立单元,每个团队直接向上汇报;这套逻辑在互联网大厂里很常见,专业的人做专业的事,每个环节都能量化考核,也方便引入外部专家。
比如:周浩从Google Gemini团队加入后,就直接负责后训练板块。
林俊旸在一次内部讨论里说过一句话,后来被在场的人传了出来:拆分打散会大幅降低研发效率,拉长迭代周期;我们现在一个bug从发现到修复可能只要半天,拆完之后,光跨团队沟通就要三天。
管理层的回应是:现在Meta、豆包都是预训练、后训练分开的。俊旸还想不依靠阿里云,自己做AI Infra,这种模式要打仗的话会有风险。
这句话里藏着两个判断。第一,Meta和字节的选择,被当作行业标准答案。第二,自己搞Infra,被视为一种风险,而不是一种能力。
争论持续了两个月,最后方案定了:水平分工,独立团队,直接汇报;林俊旸的垂直整合理念,被否定了。
技术路线的争论,只是冰山露在水面上的部分;水面之下,是更难解决的「算力内战」。
2025年年中,林俊旸团队做了个决定:组建自己的Infra团队,慢慢摆脱对阿里云PAI平台的依赖。这个决定背后的逻辑其实很合理。
PAI平台是阿里云的基础设施,要服务通义实验室的好几个团队,它的核心目标是标准化、规模化,最大化资源利用率。
但模型研发团队要的是灵活、响应快,能针对特定训练任务做深度优化;这两个目标纸面上不冲突,可到了资源分配的时候,就经常闹矛盾。
比如:
Qwen团队想调一批卡跑实验,PAI那边说档期排到下个月,这种事发生过不止一次。
自己搞Infra,意味着能掌控自己的节奏,也意味着「切割」。PAI平台同时支撑着通义实验室好几个团队,Qwen一旦独立,更是从PAI的话语权里抽走一块筹码。
要知道,PAI的考核指标里,就包括支撑了多少个大模型、服务了多少内部客户,Qwen既是它的标杆案例,也是它最重要的议价资本。
这场博弈没有公开的输赢,但有一些痕迹留了下来。
2025年秋天,Qwen团队内部开始出现一系列调整:原本负责Infra的几个核心成员被调到了其他方向,林俊旸参与技术决策的会议越来越少,更多时间都花在了和模型研发无关的事上。
今天,吴泳铭在内部信里说,要成立基础模型支持小组,由他本人、周靖人、范禺一起协调集团资源。
这句话反过来想,暴露了一个更真实的处境:基础模型的资源协调,竟然需要CEO亲自下场才能推动;一家公司最重要的战略,资源却长期得不到保障,这不是某一个人的问题,是组织的问题。
在吴泳铭开的全员沟通会上,首席HR蒋芳的表态,是另一个注脚。有人问,是不是应该不计代价挽留林俊旸,她回答:
不能推上神坛,公司不能接受非理性的要求,更不能不计代价去挽留。
这句话间歇意思是:组织稳定性,比个体的不可替代性更重要。这在工业时代的大公司里成立,在流量时代的平台公司里也基本成立,但到了AI时代,这套逻辑开始出问题了。
Google和Anthropic想得很清楚。
Logan Kilpatrick在Google的作用,本质上是一个「信任锚点」,有他在,开发者才相信Gemini的开发者生态是认真做的;Alex Albert在Anthropic做的也是同样的事,他的个人IP和公司的技术可信度,绑得死死的。
这些公司不会去讨论「能不能把某个人推上神坛」,因为他们知道,开发者社区里的神坛,是社区自己建的,公司能做的,就是别把它推倒。
而阿里,把林俊旸的影响力当成了内部的政治风险,而不是外部的竞争资产。这个理解上的偏差,是组织基因层面的问题。
阿里成长于电商和平台时代,它的组织逻辑为了管理大规模协作而设计;轮岗制度、层级汇报、警惕个人英雄主义,这些机制在那个时代很有效,因为那个时代的核心竞争力是组织效率。
但模型时代的竞争逻辑不一样了。
一个基础模型的技术路线、训练策略,还有开源社区的运营方式,高度依赖少数人的判断和信念;这不是一份可以拆分、可以轮岗、可以用标准化流程替代的工作。
当阿里用管理平台业务的方式去管理模型团队,最后就会变成:引入了外部人才,调整了组织架构,却发现原来维系开源生态的那根线,悄悄断了。
这就是用旧地图在新地形上导航,必然会遇到的困境。
林俊旸离开了,Qwen还在。
现在这个模型家族的体量很可观。衍生模型超过20万,下载量突破10亿。2025年底,它刚超越Llama,成为全球下载量第一的开源模型家族。
这个位置过去两年一直是Meta的,是阿里从Meta手里抢过来的。
现在硅谷创业公司里,到处都能看到Qwen的身影。Airbnb的客服AI在用,Windsurf编程工具在用,Groq的推理平台也在用;如果一个开发者想快速搭个原型,又不想付钱给OpenAI,Qwen基本是默认选项之一。
现在的问题是,这个人走了,这套生态还能不能续上?
周浩接手了后训练板块,他的履历没话说,Google Gemini出身,还有DeepMind背景,对多步骤强化学习、后训练对齐那一套非常熟悉。
但问题也在这里:Gemini是闭源的,周浩过去几年习惯的工作方式,是在一个确定的方向上推进项目、发论文、迭代版本。
开源社区是另一套逻辑:你要回复开发者的Issue,要接受他们的PR,要在Twitter上跟他们互动,要让陌生人觉得你愿意听他们的意见;而这些,正是维系Qwen生态的那根线。
社区的反应已经出来了。
林俊旸离职的消息确认后,Hugging Face上有人提了个Issue,问:Qwen接下来,还会保持现在的更新节奏吗?还会有人回复我们的问题吗?这些问题,现在没人能给出答案。
其实Meta也遇到过同样的问题。
Llama团队在2024到2025年之间,经历过好几轮震荡,早期推动Llama开源的几个核心人物陆续离开,有的被挖走,有的觉得Meta内部对开源的耐心越来越少。
现在Llama的下载量还在涨,但社区的抱怨也越来越多:
Issue回复变慢了,新版本的文档跟不上,PR合并的周期也拉长了。这些细节不会影响公司的财报,却会慢慢影响开发者的选择。
有个创业公司的CTO跟我说,他们最近把好几个新项目从Llama换成了Mistral,原因特别简单:Mistral的人回邮件更快。
这就是开源生态的残酷之处:下载量是存量,信任是流量。存量能吃很久,但流量每天都得重新挣。
在智远看来,阿里现在面临的问题,和Meta一样:
当一个开源项目长到足够大,大到可以影响一家公司的股价和国际声誉时,你用什么逻辑来运营它?
用商业公司的逻辑,控制成本、优化流程、对齐KPI?还是用社区的逻辑,尊重那些不拿工资但每天都在给你提bug的人?
这个问题没有标准答案,但有一个事实是确定的:
Qwen的20万衍生模型、10亿下载量,不只是阿里的资产,更是阿里和开发者社区的共有资产;林俊旸,是连接这两端的接口;现在接口换了,两端信任,需要重新建立。
后林俊旸时代,Qwen的更新节奏会变吗?社区运营的风格会变吗?把业务压在Qwen上的创业公司,会不会开始准备备份方案?这些问题,现在都没有答案。
当然,还有一个更根本的问题没有人回答:
有没有一种组织方式,能让商业化和开源生态真正兼得?智远暂时没有答案。还要进一步观察。
