千问为何“容不下”林俊旸?
3 小时前 / 阅读约11分钟
来源:36kr
阿里巴巴Qwen团队技术负责人林俊旸离职,引发关注。其与阿里AI战略产生分歧,阿里高层强调Qwen是集团战略,将坚持开源并加大投入。

昨日(3月4日)凌晨,阿里巴巴Qwen团队技术负责人林俊旸在社交媒体发文,宣告自己将离开Qwen团队,在业界引发轩然大波。

结合凤凰网科技、晚点LatePost等媒体报道,林俊旸的离职时间线尤为干脆:3月3日下午在一场内部会议上产生分歧后,林俊旸当场离开,随后正式向阿里提出辞职。几个小时后,其发布推文称自己将离开Qwen团队。

此外,林俊旸提出离职时尚未和阿里谈好相关细节,昨天阿里巴巴高层还在和林俊旸密切沟通中。

图/林俊旸个人社媒账号

今天上午,阿里巴巴集团CEO吴泳铭发布内部邮件,确认林俊旸离职,阿里云CTO周靖人将会继续带领通义实验室推进后续工作。同时阿里将成立基础模型支持小组,由吴泳铭、靖人、范禹共同协调集团资源支持基础模型建设。

吴泳铭也提到了阿里将继续坚持开源模型策略,“技术发展不进则退。发展基础大模型是我们面向未来的关键战略,我们将在继续坚持开源模型策略的同时,持续加大对人工智能领域的研发投入,加大吸纳优秀人才的力度,我们一起加油。”

汇总、梳理林俊旸和阿里这场并不算体面的分手,较为明确的一点是:双方出现了无法调和的分歧甚至矛盾。

只是矛盾爆发前,几乎所有人都没看到任何预兆。向阿里提出离职前一天,Qwen3.5小尺寸模型系列开源,马斯克评价该模型“智能密度令人印象深刻”后,林俊旸还表达了感谢。稍早一些,2月底他还在社交平台发布了招聘信息。

林俊旸的离职也不像是深思熟虑之后才做出的抉择,而是多了太多突发性、临时性。有多位接近此事的人向晚点LatePost表示,林俊旸的离职“带着遗憾”“唏嘘”“他很爱Qwen”。

少年天才自有其血性和意气风发,事实上凭借现有履历,林俊旸不论是自主创业或是另寻去处,都会是香饽饽。

同理,走一个林俊旸对阿里而言自然也算不上什么大事,总会有新人补位。

但林俊旸的这场离职风波,多少揭示出了阿里面向AI时代的部分FOMO情绪,也让阿里潜藏在水面下的隐忧加速爆发。

01 Qwen始终是集团的

从中国到全球,这几年的大模型浪潮中,AI圈最不缺的就是少年天才。

去年底加入腾讯成为首席AI科学家的姚顺雨、小米基座模型的负责人罗福莉都是95后;月之暗面的创始人杨植麟今年也才34岁。

1993年出生的林俊旸也是其中之一。Qwen大模型走到今天,他确实功不可没,甚至是不可或缺的。

但与姚顺雨和罗福莉在履新之时便已声名鹊起不同的是,林俊旸的光环很大程度上来自Qwen,来自阿里。

林俊旸是纯粹的从阿里内部成长起来的技术型高管。

2019年林俊旸通过校招加入阿里AI达摩院的智能计算实验室。当时达摩院有两个团队同时在研发大语言模型,黄非负责的AliceMind和周畅、林俊旸等人负责的M6。

2022年阿里将两条技术路线收归为M6,大模型也统一更名为Qwen系列,再到年底阿里将达摩院语言、视觉等AI团队整体并入阿里云并成立通义实验室,林俊旸成为通义千问系列大模型的技术负责人,向阿里云CTO、通义实验室负责人周靖人汇报。

随后的三年时间里,Qwen系列模型成了全球最活跃的开源模型之一。据财新网报道,Qwen系列模型下载量超过10亿次,衍生模型超过20万。

这也让林俊旸成为阿里内部升迁最快的技术高管。去年其晋升为阿里巴巴内部职级P10,是这一级别技术人才中年纪最小的员工。

图/林俊旸个人社媒

也正是因此,林俊旸此次在社交媒体上自发宣告离开消息后,很多人都觉得“不解”甚至“震惊”。

Hyperbolic Labs创始人兼CTO Yuchen Jin说林俊旸的离职是“一个时代的结束”;一位千问的研究员说“Qwen is nothing without its people.”推特上简介为魔塔社区维护者、千问贡献者的Chen Cheng评论说,“I honestly can't imagine Qwen without you.”

此外,多位千问成员对智能涌现评价说,“在资源远少于竞对的前提下,能取得今天的成绩,俊旸的领导力是核心因素之一。”一位字节人士对林俊旸的评价则是“至少是1亿美金以上级别的人才。”

越是如此,林俊旸的火速离职就越是反常。

常规逻辑下,在阿里核心业务团队担任核心技术高管,林俊旸要想离职,阿里大概率不会这么轻易放手,但从林俊旸的离职来看,双方似乎没有拉扯、没有谈判,而是快速达成了离职共识。

站在林俊旸的角度,他热爱Qwen、做出过成绩、深居核心业务部门要职,但无法留下来,可能性只有一种:其和阿里的AI战略及路线产生了不可调和的分歧或者矛盾。

站在阿里的角度,他们或许也不明白,为什么一次简单的人事变动会掀起如此大的波澜,几乎让自己在社交媒体上成为众矢之的。

图/阿里官网

他们也不得不快速出来稳定军心。智能涌现昨天报道,下午约13:00,通义实验室紧急召开了ALL hands会议,吴泳铭、周靖人、蒋芳等高管都参加了,围绕团队调整、战略方向等关键议题做内部回应。

网传的一则会议纪要图片显示,会上有员工问高层林俊旸能不能回来,蒋芳的回答是“不能推上神坛&公司不能接受非理性的要求不计代价来挽留。”

此外,阿里高层们也在会中多次强调,千问基础模型是集团当前最重要的事情,大模型的竞争不仅仅是Qwen团队的事情,而是整个阿里集团的事——无论是基础模型研发,还是底层infra建设,都将在集团层面统筹推进,“一定要超越”。

虽然当时在会上并没有更新林俊旸的动向,但这一定程度上已经给林俊旸此次的离职定了调:

Qwen的组织调整势不可挡,林俊旸的离开是组织进化过程中不可避免会出现的一个代价;

Qwen始终是集团的,个人意愿不能凌驾在集团的意志之上。

02 包袱、野心与代价:千问不得不变

如果不是林俊旸的这场离职风波,在舆论场上,阿里的AI叙事料想不会如此被动。

3月2日,阿里巴巴刚刚将AI品牌统一为千问,包括林俊旸负责的Qwen以及面向C端的应用千问App。

林俊旸提出离职当天,阿里创始人马云、集团主席蔡崇信、CEO吴泳铭、风险委员会主席邵晓锋、电商事业群CEO蒋凡、蚂蚁集团董事长井贤栋和CEO韩歆毅还现身杭州云谷学校,就AI和教育与学校进行了交流。

这是阿里过去一段时间里围绕AI的强悍攻击性的延续——

去年提出的未来十年超3800亿元的预算用在云和AI基础建设上;Qwen系列大模型的迭代速度越来越快、发布频率越来越高;C端AI应用的上新频率越来越高,千问、灵光、阿福,等等,3月2日,千问还公布了其首款AI硬件“千问AI眼镜”上线的消息。

图/千问App官微

阿里面向AI时代的焦虑和野心也藏在其中。不论是B端还是C端,它都不允许自己落后,甚至只能接受自己领先。

这一基础上,过去几年全球科技巨头的AI战场还未大规模扩展到C端时,Qwen还能够提供相对独立的舞台给“林俊旸”们的话,现在这个空间被压缩也是必然。

也正因此,此番矛盾的根源根本不是“林俊旸”,换另一个“罗俊旸”或者是“刘俊旸”,矛盾可能都会存在,只是不同的人处理方式会有不同。

本质上,在阿里成熟的组织体系内,当Qwen身上的包袱越来越重,需要承载的期望值越来越高,阿里是不太能容得下“超级个体”的个人意志的,尤其是个人意志与集团战略出现错位时。

阿里云当前正推进通义实验室技术体系团队的重构,核心举措是拆分大模型团队,从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队。

但这与林俊旸的主张相左。其认为,前沿大模型探索进入深水区后,Scaling Law的红利正在递减,预训练、后训练,乃至Infra团队和训练团队应该整合起来协同创新,才能实现类似GPT o1那样在逻辑推理深度上的范式突破。

界面新闻今天的报道也提到了另外一点:

有阿里内部人士透露,林俊旸离职的实际情况是,随着千问从基模提升到集团整体战略,公司认为需要招揽更多技术大牛,提升基模团队人才密度,特别是在大规模模型研发、工程化落地等领域经验丰富的领军人才,但这涉及到林俊旸原有权责范围调整,后者不接受。

阿里对林俊旸的能力认知或许也发生了变化。晚点报道说,阿里内部有高管对除夕夜亮相发布的Qwen-3.5并不完全满意,称其是一个“半成品”。

也有不少声音质疑,在追求商业化闭环的过程中,阿里的商业目标和技术目标出现了一定程度的错位。

林俊旸主导下,阿里Qwen在全球开源社区口碑不错,但难就难在,难以转化为商业化收入。

昨天早上,阿里前技术高管、现为Lepton AI创始人的贾扬清针对林俊旸的离职发布长文评论提到,对公司而言,平衡开源和商业利益确实非常困难。其同时提到,“开源愿景和商业优先事项之间是否存在摩擦?这纯属猜测,但如果不存在摩擦,那将是例外,而非普遍现象。”

阿里已经体现出了某种程度上的商业化焦虑。比如有接近阿里的人士向腾讯新闻透露,阿里Qwen团队的考核指标,要看DAU。不过界面新闻报道,Qwen团队今年的KPI确有调整,但并非传言中的用千问App这类消费级应用的DAU来衡量基础模型团队。

这背后,本质上是阿里在AI时代的FOMO情绪,既想要在开源模型生态上持续赢得领先地位,又想尽快跑通商业化闭环。

图/阿里官网

吴泳铭今天早上在内部信中明确阿里将继续坚持开源路线,客观上算是对这一讨论做出回应。但争议显然不会消失。

另一方面,尽管两头都想抓,阿里巴巴在基础模型团队上的训练资源却相对有限。

参考36氪的报道,现在阿里支撑Qwen家族超过百款细分模型更新主力的Qwen团队仅有100多人,即使算上通义实验室整体团队也刚刚超过600人。也有不少Qwen人士曾表示,Qwen的算力、Infra建设都长期缺乏资源和支持,阻碍了模型的迭代速度。

阿里高层在昨天的ALL hands会议上也讨论了这点。

周靖人说,团队处于“资源紧张状态”,内部阿里云不好用有很多历史原因,正在做整体规划。吴泳铭也说自己不知道资源被集团卡了脖子,问题出在了信息传递流程上。

从这个角度看,林俊旸此番离职引发的风波对阿里而言并非全然是坏事。问题在现在暴露,潜在风险反而更小。

人才流失当然也是实际损失,但对阿里而言也是可接受范围内的代价,世界是属于年轻人的,有才华的年轻人也是无限的。