递归时代的权力重构（一）预警、发布与规则：Anthropic的“递归自我改进”悖论 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

递归时代的权力重构（一）预警、发布与规则：Anthropic的“递归自我改进”悖论

4 小时前 / 阅读约10分钟

来源：36kr

Anthropic发布新一代AI模型Claude Fable 5与Mythos 5，强调AI的递归自我改进趋势，呼吁全球暂停前沿开发。同时，美国AI安全行政命令落地，AI发展进入复杂图景。

2026年6月9日，AI巨头Anthropic以一种前所未有的方式发布了其新一代旗舰模型：Claude Fable 5与Claude Mythos 5。Fable 5面向公众，而Mythos 5仅向全球约200家经过严格审查的关键基础设施和网络安全机构开放。Claude Mythos 5相较于此前仅限于“玻璃之翼计划”（Project Glasswing）内部使用的Mythos Preview，进行了全方位地提升，被誉为“拥有全球最强大网络安全能力”的模型。

如果其数据真实、而非仅仅是营销策略，那么这种惊人的AI进步速度，或许可以归功于Anthropic所说的“递归自我改进（RSI）”。仅仅在五天前（6月4日），Anthropic刚刚发布了一篇题为《当AI构建自身》的重磅报告，严肃警告AI的“递归自我改进”（RSI）的趋势正在加速，并公开呼吁全球顶尖实验室考虑“放缓乃至暂停”前沿开发。

更富戏剧性的是，几乎在同一时间，一度被推迟的美国AI安全行政命令最终落地，其核心是从传闻中的“90天强制审查”退化为“30天自愿评估”，试图在产业竞争与国家安全间寻找脆弱的平衡。

一边是呼吁全球“踩刹车”的风险警告，另一边是加速迭代并分层释放的AI产品；一边是政府试图建立监管“软抓手”，另一边是企业已先行构建了私有化的准入联盟。这一系列看似矛盾的事件，共同勾勒出AI发展进入“递归时代”之前的一幅复杂图景：技术突破正从被监管的客体，跃升为定义游戏规则的主体。

我们将发布3篇具有连续性的文章，分别从技术现实、治理困境和伦理叙事的角度，来解读上述一系列复杂事件所呈现的。

第一篇：预警、发布与规则：Anthropic的“递归自我改进”悖论

传统的产品发布，其叙事逻辑是展示“结果”：新的功能、更强的性能、更好的体验。

但Anthropic此次的产品，却呈现了一个历时两个月、环环相扣的“过程”：最先以“过于强大，不可公开”为由，将Mythos Preview模型限制于“Project Glasswing”核心伙伴访问；紧接着，发布内部报告《当AI构建自身》，揭示“AI研发过程本身正在AI化、进化速度即将脱离人类掌控”的根本趋势，由此呼吁“暂停开发”；最后，正式产品Fable 5/Mythos 5登场，并内置了严密的分级访问控制。

因此，《当AI构建自身》可被视为对Fable 5/Mythos 5发布的铺垫和诠释，用AI研发过程证明其产品不仅功能强大，其“生产方式”更在发生革命。

一、研发主体转移：当80%的代码不再由人类书写

在Anthropic的框架中，AI研发被分解为一条清晰的链条：

（1）执行层：写代码、跑实验、产出结果；

（2）审查/优化层：审查代码、设计实验、排查故障；

（3）判断/决策层：选择研究什么问题、评估哪些结果可信、决定何时放弃一条路径——这就是“研究品味”。

报告显示，AI在“执行”层面的能力正呈指数级跃迁。截至2026年5月，Anthropic合入代码库的代码中，超80%由Claude撰写；而在2025年2月Claude Code发布之前，这个数字还停留在“个位数”。

随之而来的是人类角色的根本性转变。一位Anthropic员工坦言：“我已经大约5个月没自己写过任何代码了。”人类正从“执行者”大规模转向“审查者”与“指令者”。量化数据显示，2026年工程师日均代码贡献量是2024年的8倍，这并非人类更勤奋了，而是AI成为了主要生产力。

不仅如此，AI还正沿着“执行-审查-决策”这一链条“自下而上”地自动化人类工作。目前，执行层（80%代码由AI生成）和审查层（AI优化效率远超人类）已被大幅自动化，瓶颈已上移至“研究品味”。

这里所谓“研究品味”的实质，是人类（或任何智能体）在面对未知时，依据经验、直觉、伦理观和偏好，决定“什么值得探索”、“什么路径更有希望”、“什么结果真正重要”的核心能力。在任何复杂、非结构化的专业领域，包括法律、医疗、商业、艺术等，都存在类似的“品味”层，这是专业权威的真正基石，也是目前人类仅存的比较优势。

然而，报告中的一项实验暗示，人类最后这一堡垒也并非固若金汤。在129个研究人员曾“走弯路”的决策节点上，让Claude根据此前信息提出下一步建议，并由另一个知晓完整结果的Claude评判，结果显示，最新模型在64%的情况下能提出比人类当时更优的选择。它明确发出信号：AI在复杂决策中的判断力正在快速逼近人类。人类的终极创造性优势能维持多久，成了一个悬而未决的、令人不安的问题。

二、进化逻辑：递归式自我改进的“来与未来之间”

在AI语境下，“递归自我改进”（Recursive Self-Improvement, RSI）特指一个能够完全自主设计、实现并验证其下一代版本的人工智能系统。其核心在于形成一个无需人类介入的、自我强化的正反馈闭环。

Anthropic清晰地描绘了这条演进路径：从人类完全主导（2021-2023），到AI辅助（2023-2025），再到AI作为编程智能体（2025-2026），最终指向一个未知的“20XX年”——即RSI可能实现的未来。Anthropic的明确立场是：他们尚未实现RSI，但正加速逼近其门槛。按照当前趋势，如果给予足够算力，Anthropic或某个科技巨头最终可能出现能完全自主设计后继模型的AI。

当然，Anthropic所警示的，并非一个拥有“自主意识”、“天网”式的AI，也非对“奇点”的科幻式恐惧。它警示的RSI是一种更加现实、且迫在眉睫的“目标主权”转移的风险——当AI在“如何做”（执行与优化）上越来越自主，而人类在“做什么”和“为何做”（目标与价值）上的控制一旦出现丝毫疏漏，两者的“能力差”就会演变成致命的“控制权差”。

Fable 5/Mythos 5的发布，说明了我们正在无限接近这种风险。而Anthropic对这两款产品进行“差异化访问”的设置，也在一定程度上可以缓解上述风险。其中，Fable 5因受众比Mythos更加广泛，因此额外增加了一层安全防护措施：当用户对某些主题进行查询，将由功能更弱的模型 Claude Opus 4.8 进行响应。

然而，这种“为进化而进化”的内生逻辑及其可能到达的RSI结果，是否是人类社会所需要和期待的，就成为一个问题。

三、架构冲击：当技术进化逻辑碾压社会适应逻辑

当技术的进化速度远超社会制度、经济结构和人类认知的适应速度时，便会产生一种“进步冗余”。Anthropic的报告接下来自然地提到了这一由技术转化而来的“社会困境”：即便模型能力今天冻结，世界也再回不到过去；而如果趋势持续，当AI的进化逻辑开始系统性地挑战社会的适应逻辑时，其影响便从“工具层”深入“架构层”。

最明显最严峻的挑战在于治理。技术的迭代周期以月甚至周计，而法律、伦理框架和社会共识的形成则需要数年甚至数十年。这种“时间鸿沟”使得任何试图规范前沿AI的尝试都显得滞后和笨拙。正如报告所指出的，再强大的智能也无法“让选举早于宪法规定的时间举行，也无法在一个周末之内把陌生人变成老朋友”。社会的“体感速度”仍将由最慢的瓶颈——制度、关系和信任——决定，而上游的实验室已在以算力的速度狂奔。这导致了监管的普遍无力感，以及政策制定者倾向于采取“适应性治理”等更具弹性的框架。

从更微观的角度来看Fable 5/Mythos 5的“差异化访问”机制，也可以更直观更具体地感知上述挑战。Anthropic的Project Glasswing是一种主动的战略选择，本是旨在为防御方（如关键基础设施运营商、核心软件供应商）创造一个“时间窗口”和“能力窗口”。在这个窗口期内，防御方可以独家或优先利用AI来发现并修补自身系统的漏洞，从而在攻击方获得或发展出同等能力之前，建立起防御的“护城河”。这本质上是在人为制造并扩大攻防之间的“能力差”。

然而，当Mythos这类模型被锁在联盟内，它所代表的、可能用于加速新药研发、极端气候模拟或教育普及的“正向颠覆潜力”，其受益范围被急剧收窄。这相当于将一项可能普惠的技术，人为地“奢侈化”和“专用化”。社会付出的是整体进步的潜在速度，换取的是（理论上）针对特定高风险领域（如国家安全）的、更集中的安全保障。然而，这个权衡是否值得、由谁来决定，完全是一个黑箱。

（下一篇预告：《私序的崛起：玻璃之翼与递归时代的治理困局》将探讨，当最强大的AI能力被锁进科技巨头主导的私人俱乐部，这是应对监管失效的务实方案，还是权力向非公权力主体集中的危险信号？）

【免责声明】本文撰写所需的信息采集自合法公开的渠道，我们无法对信息的真实性、完整性和准确性提供任何形式的保证。本文仅为分享、交流信息之目的，不构成对任何企业、组织和个人的决策依据。

上一篇：王坚九问九答：六年前我们看的是泳池，如今中美面朝同一片大海

下一篇：ChatGPT教我女儿自杀，加拿大母亲心碎起诉OpenAI，别把AI当医生

返回列表

热文阅读

2 天前

梁文锋当年高考状元照片，及报道曝光：过了清华线，报了浙大

2 天前

公开版Mythos上线，Claude 最强模型开始分层发售

16 小时前

瞄准AI代理赛道 OpenAI收购云端平台强化Codex竞争力