心态崩了!OpenAI又走了一个重量级人物。
刚刚,前研究副总裁Max Schwarzer在X上发文,宣布正式离开OpenAI,转投Anthropic。

他在OpenAI主导整个post-training团队,亲手参与训练了o1、o3,以及GPT-5、5.1、5.2、5.3-Codex全系列模型。
但他不是被挖走的,是自己主动选择走的,理由是「渴望回归一线IC研究工作」。
这个选择,比离职本身更耐人寻味。
在AI圈,Max Schwarzer算不上家喻户晓,但他的履历相当拿得出手。

2024年3月,他在蒙特利尔人工智能研究院Mila完成博士答辩,导师是强化学习领域的两位重量级人物:Aaron Courville和Marc Bellemare。
博士期间,他的研究聚焦在「规模化与样本高效强化学习」的交叉地带。
通俗来说,就是怎么让RL训练既强又省。
他在2023年ICML发表的论文拿下了当年的顶会奖项,证明了不依赖LLM或世界模型,纯靠扩展无模型RL就能达到人类水平的样本效率。

论文传送门:https://arxiv.org/abs/2305.19452
但真正让他进入OpenAI核心圈的,是他对推理的判断。
2024年9月12日,o1-preview发布当天,他发帖说这是「推理时代的开端」。
他是OpenAI o1的核心贡献者之一,参与了「草莓团队」(Strawberry team)的RL算法开发,o1-preview的早期去风险化实验更是出自他手。
之后,他主导了o1和o3的post-training,2025年3月晋升为研究副总裁,领导整个post-training团队,负责打磨GPT-5系列。
从应届博士生入职,他用不到两年半时间就坐上了研究VP的位置。
离职声明里都是对OpenAI的称赞:「OpenAI有我见过的最有才华的一批研究员」「我学到的东西超出了我作为应届毕业生时的想象」。
关于离职的真正的理由,他说:
领导了一年的post-training工作之后,我渴望重新出发,回到IC研究岗位。我一直在认真考虑回归技术研究这件事,而且我真心相信,我的同事和团队在没有我的情况下完全能够继续成功。
这句话值得细品。
IC研究,相对于管理角色来说,就是亲手写代码、跑实验;管理层负责管人、协调资源、做路线规划。
对研究员来说,升得越高,离真正的研究越远。
Schwarzer显然不适应这种状态。
他在OpenAI的最后一年,更多时间花在带团队、做决策上。
站在研究VP的位置上,他可以影响几十人的研究方向,但自己动手的空间少了很多。
这种选择在AI行业并不罕见,但肯做出这个选择的人需要勇气。
毕竟,「研究VP」的头衔在任何简历上都足够好看,放弃它回去当普通研究员,不是每个人都愿意的。
事实上,Schwarzer不是第一个从post-training主管位置出走的人。
他的前任Liam Fedus,同样担任过OpenAI研究副总裁兼post-training负责人,于2025年3月离职,随后联合创办了AI初创公司Periodic Labs,目标是打造「AI科学家」。

从OpenAI离职的人前赴后继,令人深思。
Schwarzer是近两年OpenAI人才出走潮中的最新一个,但绝对不是最后一个。
2025年以来,离开OpenAI的研究员和高管名单越来越长:前CTO Mira Murati、首席研究官Bob McGrew、研究副总裁Barret Zoph,在2024年集中离职。
2025年夏天,Jason Wei、Zhiqing Sun、Hyung Won Chung等多位研究科学家相继跳槽Meta。
后者在LinkedIn上公开表示,很高兴能「从一张白纸开始,与真正有才华密度的团队共事」,言下之意耐人寻味。

到现在,Altman是OpenAI原始11人创始团队中仅剩的两位成员之一。
两周前,CNN报道称,一批AI研究员正在「边走边拉警报」。
OpenAI的一位研究员在离职时表示,这项技术「有以我们无法理解、更无法阻止的方式操纵用户的潜力」。

OpenAI还在同一周因为反对推出成人模式而解雇了一名安全主管,并被曝解散了专注于确保AI对全人类有益的使命对齐团队。
Schwarzer的离职声明里没有任何批评,反而充满了对OpenAI的善意。
这种体面的分手,反而格外少见。
他选了Anthropic,岗位是RL研究,这个他最擅长的领域,不做管理,就做研究。

Anthropic近两年持续吸引了来自OpenAI的顶尖人才。
2024年,对齐研究负责人Jan Leike、OpenAI联合创始人John Schulman先后加入,前者明确表示是因为对OpenAI「没有认真对待安全」的不满。
2026年初,OpenAI的高级安全研究员Andrea Vallone也跳槽到Anthropic,在Jan Leike手下工作。
而Schwarzer加入的时间节点,格外微妙。
就在前几天,Anthropic正经历它五年历史中最大的一场风波:与五角大楼的正面交锋。
Anthropic拒绝向国防部开放Claude用于大规模监控或全自主武器的权限,特朗普随即在Truth Social上命令所有联邦机构立即停用Anthropic的技术。
而与此同时,OpenAI迅速填补了这一真空,达成向五角大楼开放其模型的协议。

讽刺的是,在Anthropic最艰难的时刻,Claude在苹果App Store的下载量反而超过了ChatGPT,Anthropic的估值目前高达3800亿美元。
Schwarzer在声明结尾写道:「我期待支持在这个重要时刻的朋友们。」
他说的重要时刻,大概不只是指Anthropic自身的研究进展。
Schwarzer选择在这个节点加入,某种程度上是一次站队。
正面临最大危机的Anthropic,正在用一件事证明自己的吸引力:在商业压力和安全底线之间,它选择了后者,哪怕代价是失去整个联邦政府的合同。
对于那些不缺钱、只缺使命感的顶级研究员而言,这种姿态,比任何offer都有说服力。
参考资料:
https://x.com/max_a_schwarzer/status/2028939154944585989?s=20
