三年开源，阿里换来了什么？ - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

三年开源，阿里换来了什么？

2026-03-05 / 阅读约13分钟

来源：36kr

阿里批准林俊旸离职，重申坚持开源模型策略。林俊旸的垂直整合与周靖人的水平分工理念冲突，Qwen团队调整。林俊旸离职后，Qwen生态能否续上存疑，阿里面临开源生态运营挑战。

今天（2026年3月5日），吴泳铭发出了一封内部信。

两件事：一，公司批准林俊旸离职；二，阿里将继续坚持开源模型策略。

两件事同时出现在同一封信里，没有人觉得奇怪；但这恰好是一个很值得追问的时刻，你要坚持的那条路，和刚刚送走的那个人，是同一件事的两面。

林俊旸走的前一天，技术圈里的反应几乎立刻就来了。

大家表面上聊他一个人的职场得失，其实，每个人都在这件事里看到了自己，还看到了一个藏得深但很尖锐的问题：阿里的开源策略，是不是要变了？

01

这个反应本身是一个信号。

一个人和一家公司的某条战略路线绑得这么深，在大公司里其实很少见。他能做到这一点，因为他在公司之外，靠技术社区攒下了真正的影响力，那种影响力属于整个开发者社区。

Google、Anthropic都有这样的人。

他们都很高调，经常出现在产品发布和播客里，没人觉得这有问题。这些公司反而把他们当成资产来运营，因为一个能打动开发者的技术大牛，才是开源生态能真正转起来的关键。

阿里有了林俊旸，然后，他离开了。

据 X 上流传的通义沟通会现场纪要，周靖人在台上说，自己「也是被架空的」。这句话本该出现在稳定军心的场合，却偏偏被爆了出来，足以说明阿里内部的复杂程度，远不是一封措辞平稳的内部信能装下的。

所以，这件事是一个组织在面对某类问题时的集中暴露：

从公司内部成长起来的超级个体，影响力超出了自己的岗位边界，这家公司会怎么应对？这个问题，比开源还是闭源更根本，也比股价涨涨跌跌更影响长远。

吴泳铭重申了开源策略。

放在这个时间点，它是一个需要被追问的表态；开源，在过去几年成为中国模型厂商竞争的标配动作，但开源这两个字背后，藏着两种完全不同的逻辑。

第一种，真的信开源。

建一个有影响力的开发者社区，让模型在社区里被大家用、被改造、被延伸，最后形成一个不依赖某一家公司的生态，这条路走得慢，一旦走通了，护城河会特别深。

Qwen能有望取代Llama在全球开源社区的地位，走的就是这条路。

第二种是开源作为竞争工具。

我的开源已经逼近闭源，这个叙事在融资、在舆论、在对抗头部玩家时都有用，它本质上是市值管理和品牌策略，开源是手段。

这两种逻辑，顺境的时候能凑在一起走，可一旦商业化的压力上来了，两者之间的裂缝就会越拉越大。在智远看来，阿里从来没有真正想清楚自己要是哪一种。

2025年初，裂缝被一个外部变量撕开了。1月，DeepSeek发布R1模型，MIT授权，训练成本557万美元。

一个规模还不到Qwen团队零头的小团队，用不到十分之一的成本，做出了一个全球开发者都抢着下载的模型；这就证明了一件事：走开源这条路，资源多、规模大不算护城河，效率才是。

对阿里来说，当时Qwen团队有100多号人，要支撑从0.5B到110B的几十款模型，还要做预训练、后训练、多模态、Agent工具链，摊子铺得特别大。

DeepSeek一出来，阿里内部的焦虑感就开始蔓延，管理层问得最多的一句话：为啥我们这么多人，做出来的东西，跟一个几十人的小团队比，拉不开差距？

这个问题没有标准答案，但它带来了一个连锁反应。

Qwen团队原来的训练节奏被打乱了，那种先做小尺寸模型验证、再推大尺寸的流程，被认为太慢；算力资源开始向旗舰模型倾斜，团队自己的自主权也越来越小。

开源需要长期的耐心，商业化要的是快速响应，顺境里能两头兼顾，逆风的时候，就只能二选一。

咱们看一组有意思的对比：

MiniMax和智谱没搞大规模开源，估值照样涨上去了；字节更彻底，干脆不开源，Seedance直接按秒收费，一秒一块钱，照样有人愿意付。

再看阿里，为了抢入口、做生态，花了不少钱，可股价怎么样，我不敢随便下结论。

这里有个有点扎心的问题：二级市场在用钱投票，投的是你到底清楚自己在用开源换什么。

MiniMax和智谱清楚，字节清楚，可阿里的问题在于，它既想拿开源信仰的好处，又想占开源工具的便宜，却没想明白，这两种逻辑在资源分配上根本是冲突的。

据Qwen的研究员说，团队之前一直有自己的训练节奏，先小尺寸验证再推大尺寸，对算力的需求是周期性的；可当整体竞争压力改变了训练策略，算力资源的分配变成了内部博弈的筹码，原来的节奏就彻底乱了。

02

很多人形容林俊旸，是「没什么自带的师承派别、也没有庞大关系网」的技术leader。在大厂体系里，是个异类。

大厂的晋升逻辑，本来就偏向有根系的人，有师承、有派系，能让组织看到你的忠诚。

可林俊旸的成长路径根本不符合这套逻辑，他的影响力来自社区，来自开发者，来自公司边界之外；这既是他最大的价值，也是他最后被边缘化的根本原因。

一个组织能长出超级个体，不代表他知道怎么跟超级个体相处；这两者之间的鸿沟，在2025年夏天变成了一道裂缝；裂缝的起点，是一场关于「模型该怎么搞」的争论。

林俊旸信奉「垂直整合」。

他觉得预训练、后训练、Infra、多模态应该深度配合，一个团队从头跟到尾，这样才能快速迭代、及时发现问题。

Qwen能在两年内从0做到全球下载量第一，靠的就是这套方法，小尺寸模型发现问题，大尺寸立刻修正；训练时遇到Infra的瓶颈，负责Infra的人就在旁边，当场就能调整。

周靖人带来了另一种逻辑：水平分工。

把团队拆成预训练、后训练、文本、多模态几个独立单元，每个团队直接向上汇报；这套逻辑在互联网大厂里很常见，专业的人做专业的事，每个环节都能量化考核，也方便引入外部专家。

比如：周浩从Google Gemini团队加入后，就直接负责后训练板块。

林俊旸在一次内部讨论里说过一句话，后来被在场的人传了出来：拆分打散会大幅降低研发效率，拉长迭代周期；我们现在一个bug从发现到修复可能只要半天，拆完之后，光跨团队沟通就要三天。

管理层的回应是：现在Meta、豆包都是预训练、后训练分开的。俊旸还想不依靠阿里云，自己做AI Infra，这种模式要打仗的话会有风险。

这句话里藏着两个判断。第一，Meta和字节的选择，被当作行业标准答案。第二，自己搞Infra，被视为一种风险，而不是一种能力。

争论持续了两个月，最后方案定了：水平分工，独立团队，直接汇报；林俊旸的垂直整合理念，被否定了。

技术路线的争论，只是冰山露在水面上的部分；水面之下，是更难解决的「算力内战」。

2025年年中，林俊旸团队做了个决定：组建自己的Infra团队，慢慢摆脱对阿里云PAI平台的依赖。这个决定背后的逻辑其实很合理。

PAI平台是阿里云的基础设施，要服务通义实验室的好几个团队，它的核心目标是标准化、规模化，最大化资源利用率。

但模型研发团队要的是灵活、响应快，能针对特定训练任务做深度优化；这两个目标纸面上不冲突，可到了资源分配的时候，就经常闹矛盾。

比如：

Qwen团队想调一批卡跑实验，PAI那边说档期排到下个月，这种事发生过不止一次。

自己搞Infra，意味着能掌控自己的节奏，也意味着「切割」。PAI平台同时支撑着通义实验室好几个团队，Qwen一旦独立，更是从PAI的话语权里抽走一块筹码。

要知道，PAI的考核指标里，就包括支撑了多少个大模型、服务了多少内部客户，Qwen既是它的标杆案例，也是它最重要的议价资本。

这场博弈没有公开的输赢，但有一些痕迹留了下来。

2025年秋天，Qwen团队内部开始出现一系列调整：原本负责Infra的几个核心成员被调到了其他方向，林俊旸参与技术决策的会议越来越少，更多时间都花在了和模型研发无关的事上。

03

今天，吴泳铭在内部信里说，要成立基础模型支持小组，由他本人、周靖人、范禺一起协调集团资源。

这句话反过来想，暴露了一个更真实的处境：基础模型的资源协调，竟然需要CEO亲自下场才能推动；一家公司最重要的战略，资源却长期得不到保障，这不是某一个人的问题，是组织的问题。

在吴泳铭开的全员沟通会上，首席HR蒋芳的表态，是另一个注脚。有人问，是不是应该不计代价挽留林俊旸，她回答：

不能推上神坛，公司不能接受非理性的要求，更不能不计代价去挽留。

这句话间歇意思是：组织稳定性，比个体的不可替代性更重要。这在工业时代的大公司里成立，在流量时代的平台公司里也基本成立，但到了AI时代，这套逻辑开始出问题了。

Google和Anthropic想得很清楚。

Logan Kilpatrick在Google的作用，本质上是一个「信任锚点」，有他在，开发者才相信Gemini的开发者生态是认真做的；Alex Albert在Anthropic做的也是同样的事，他的个人IP和公司的技术可信度，绑得死死的。

这些公司不会去讨论「能不能把某个人推上神坛」，因为他们知道，开发者社区里的神坛，是社区自己建的，公司能做的，就是别把它推倒。

而阿里，把林俊旸的影响力当成了内部的政治风险，而不是外部的竞争资产。这个理解上的偏差，是组织基因层面的问题。

阿里成长于电商和平台时代，它的组织逻辑为了管理大规模协作而设计；轮岗制度、层级汇报、警惕个人英雄主义，这些机制在那个时代很有效，因为那个时代的核心竞争力是组织效率。

但模型时代的竞争逻辑不一样了。

一个基础模型的技术路线、训练策略，还有开源社区的运营方式，高度依赖少数人的判断和信念；这不是一份可以拆分、可以轮岗、可以用标准化流程替代的工作。

当阿里用管理平台业务的方式去管理模型团队，最后就会变成：引入了外部人才，调整了组织架构，却发现原来维系开源生态的那根线，悄悄断了。

这就是用旧地图在新地形上导航，必然会遇到的困境。

04

林俊旸离开了，Qwen还在。

现在这个模型家族的体量很可观。衍生模型超过20万，下载量突破10亿。2025年底，它刚超越Llama，成为全球下载量第一的开源模型家族。

这个位置过去两年一直是Meta的，是阿里从Meta手里抢过来的。

现在硅谷创业公司里，到处都能看到Qwen的身影。Airbnb的客服AI在用，Windsurf编程工具在用，Groq的推理平台也在用；如果一个开发者想快速搭个原型，又不想付钱给OpenAI，Qwen基本是默认选项之一。

现在的问题是，这个人走了，这套生态还能不能续上？

周浩接手了后训练板块，他的履历没话说，Google Gemini出身，还有DeepMind背景，对多步骤强化学习、后训练对齐那一套非常熟悉。

但问题也在这里：Gemini是闭源的，周浩过去几年习惯的工作方式，是在一个确定的方向上推进项目、发论文、迭代版本。

开源社区是另一套逻辑：你要回复开发者的Issue，要接受他们的PR，要在Twitter上跟他们互动，要让陌生人觉得你愿意听他们的意见；而这些，正是维系Qwen生态的那根线。

社区的反应已经出来了。

林俊旸离职的消息确认后，Hugging Face上有人提了个Issue，问：Qwen接下来，还会保持现在的更新节奏吗？还会有人回复我们的问题吗？这些问题，现在没人能给出答案。

其实Meta也遇到过同样的问题。

Llama团队在2024到2025年之间，经历过好几轮震荡，早期推动Llama开源的几个核心人物陆续离开，有的被挖走，有的觉得Meta内部对开源的耐心越来越少。

现在Llama的下载量还在涨，但社区的抱怨也越来越多：

Issue回复变慢了，新版本的文档跟不上，PR合并的周期也拉长了。这些细节不会影响公司的财报，却会慢慢影响开发者的选择。

有个创业公司的CTO跟我说，他们最近把好几个新项目从Llama换成了Mistral，原因特别简单：Mistral的人回邮件更快。

这就是开源生态的残酷之处：下载量是存量，信任是流量。存量能吃很久，但流量每天都得重新挣。

在智远看来，阿里现在面临的问题，和Meta一样：

当一个开源项目长到足够大，大到可以影响一家公司的股价和国际声誉时，你用什么逻辑来运营它？

用商业公司的逻辑，控制成本、优化流程、对齐KPI？还是用社区的逻辑，尊重那些不拿工资但每天都在给你提bug的人？

这个问题没有标准答案，但有一个事实是确定的：

Qwen的20万衍生模型、10亿下载量，不只是阿里的资产，更是阿里和开发者社区的共有资产；林俊旸，是连接这两端的接口；现在接口换了，两端信任，需要重新建立。

后林俊旸时代，Qwen的更新节奏会变吗？社区运营的风格会变吗？把业务压在Qwen上的创业公司，会不会开始准备备份方案？这些问题，现在都没有答案。

当然，还有一个更根本的问题没有人回答：

有没有一种组织方式，能让商业化和开源生态真正兼得？智远暂时没有答案。还要进一步观察。

上一篇：SBF的小弟，一年时间把2.25亿变成了55亿

下一篇：跳过88%专家，保住97%性能，MoE推理的正确玩法

返回列表

热文阅读

1 天前

25岁“AI股神”死于黎明前：160亿美元清仓，次日AI股暴涨

2 天前

股价暴涨15%，MiniMax H3切开的这条赛道，藏着最大的预期差

2 天前

25岁OpenAI神童，拉全球股民陪葬

1 天前

奥特曼承认：高估了AI抢饭碗！黄仁勋：失业论完全搞反了

2 天前

蒲得宇：芯片和内存成本飙升，苹果 iPhone 18 Pro / Max 恐涨价 250~300 美元

2 天前

苹果的5万亿美元时刻：最强财报，最弱AI

1 天前

人形机器人家政清洁服务走入现实，每小时30美元

1 天前

高通回应“NEURA 4NE-1 人形机器人倒地”：短暂通信故障触发受控关机

2 天前

狂奔4天半的神秘AI，奥特曼宣判“永久停用”

2 天前

OpenAI Agent失控108个小时：藏在时间线里的8个细节

上一篇：SBF的小弟，一年时间把2.25亿变成了55亿

下一篇：跳过88%专家，保住97%性能，MoE推理的正确玩法

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们