
2026年6月9日,AI巨头Anthropic以一种前所未有的方式发布了其新一代旗舰模型:Claude Fable 5与Claude Mythos 5。Fable 5面向公众,而Mythos 5仅向全球约200家经过严格审查的关键基础设施和网络安全机构开放。Claude Mythos 5相较于此前仅限于“玻璃之翼计划”(Project Glasswing)内部使用的Mythos Preview,进行了全方位地提升,被誉为“拥有全球最强大网络安全能力”的模型。
如果其数据真实、而非仅仅是营销策略,那么这种惊人的AI进步速度,或许可以归功于Anthropic所说的“递归自我改进(RSI)”。仅仅在五天前(6月4日),Anthropic刚刚发布了一篇题为《当AI构建自身》的重磅报告,严肃警告AI的“递归自我改进”(RSI)的趋势正在加速,并公开呼吁全球顶尖实验室考虑“放缓乃至暂停”前沿开发。
更富戏剧性的是,几乎在同一时间,一度被推迟的美国AI安全行政命令最终落地,其核心是从传闻中的“90天强制审查”退化为“30天自愿评估”,试图在产业竞争与国家安全间寻找脆弱的平衡。
一边是呼吁全球“踩刹车”的风险警告,另一边是加速迭代并分层释放的AI产品;一边是政府试图建立监管“软抓手”,另一边是企业已先行构建了私有化的准入联盟。这一系列看似矛盾的事件,共同勾勒出AI发展进入“递归时代”之前的一幅复杂图景:技术突破正从被监管的客体,跃升为定义游戏规则的主体。
我们将发布3篇具有连续性的文章,分别从技术现实、治理困境和伦理叙事的角度,来解读上述一系列复杂事件所呈现的。
传统的产品发布,其叙事逻辑是展示“结果”:新的功能、更强的性能、更好的体验。
但Anthropic此次的产品,却呈现了一个历时两个月、环环相扣的“过程”:最先以“过于强大,不可公开”为由,将Mythos Preview模型限制于“Project Glasswing”核心伙伴访问;紧接着,发布内部报告《当AI构建自身》,揭示“AI研发过程本身正在AI化、进化速度即将脱离人类掌控”的根本趋势,由此呼吁“暂停开发”;最后,正式产品Fable 5/Mythos 5登场,并内置了严密的分级访问控制。
因此,《当AI构建自身》可被视为对Fable 5/Mythos 5发布的铺垫和诠释,用AI研发过程证明其产品不仅功能强大,其“生产方式”更在发生革命。
在Anthropic的框架中,AI研发被分解为一条清晰的链条:
(1)执行层:写代码、跑实验、产出结果;
(2)审查/优化层:审查代码、设计实验、排查故障;
(3)判断/决策层:选择研究什么问题、评估哪些结果可信、决定何时放弃一条路径——这就是“研究品味”。
报告显示,AI在“执行”层面的能力正呈指数级跃迁。截至2026年5月,Anthropic合入代码库的代码中,超80%由Claude撰写;而在2025年2月Claude Code发布之前,这个数字还停留在“个位数”。
随之而来的是人类角色的根本性转变。一位Anthropic员工坦言:“我已经大约5个月没自己写过任何代码了。”人类正从“执行者”大规模转向“审查者”与“指令者”。量化数据显示,2026年工程师日均代码贡献量是2024年的8倍,这并非人类更勤奋了,而是AI成为了主要生产力。
不仅如此,AI还正沿着“执行-审查-决策”这一链条“自下而上”地自动化人类工作。目前,执行层(80%代码由AI生成)和审查层(AI优化效率远超人类)已被大幅自动化,瓶颈已上移至“研究品味”。
这里所谓“研究品味”的实质,是人类(或任何智能体)在面对未知时,依据经验、直觉、伦理观和偏好,决定“什么值得探索”、“什么路径更有希望”、“什么结果真正重要”的核心能力。在任何复杂、非结构化的专业领域,包括法律、医疗、商业、艺术等,都存在类似的“品味”层,这是专业权威的真正基石,也是目前人类仅存的比较优势。
然而,报告中的一项实验暗示,人类最后这一堡垒也并非固若金汤。在129个研究人员曾“走弯路”的决策节点上,让Claude根据此前信息提出下一步建议,并由另一个知晓完整结果的Claude评判,结果显示,最新模型在64%的情况下能提出比人类当时更优的选择。它明确发出信号:AI在复杂决策中的判断力正在快速逼近人类。人类的终极创造性优势能维持多久,成了一个悬而未决的、令人不安的问题。
在AI语境下,“递归自我改进”(Recursive Self-Improvement, RSI)特指一个能够完全自主设计、实现并验证其下一代版本的人工智能系统。其核心在于形成一个无需人类介入的、自我强化的正反馈闭环。
Anthropic清晰地描绘了这条演进路径:从人类完全主导(2021-2023),到AI辅助(2023-2025),再到AI作为编程智能体(2025-2026),最终指向一个未知的“20XX年”——即RSI可能实现的未来。Anthropic的明确立场是:他们尚未实现RSI,但正加速逼近其门槛。按照当前趋势,如果给予足够算力,Anthropic或某个科技巨头最终可能出现能完全自主设计后继模型的AI。
当然,Anthropic所警示的,并非一个拥有“自主意识”、“天网”式的AI,也非对“奇点”的科幻式恐惧。它警示的RSI是一种更加现实、且迫在眉睫的“目标主权”转移的风险——当AI在“如何做”(执行与优化)上越来越自主,而人类在“做什么”和“为何做”(目标与价值)上的控制一旦出现丝毫疏漏,两者的“能力差”就会演变成致命的“控制权差”。
Fable 5/Mythos 5的发布,说明了我们正在无限接近这种风险。而Anthropic对这两款产品进行“差异化访问”的设置,也在一定程度上可以缓解上述风险。其中,Fable 5因受众比Mythos更加广泛,因此额外增加了一层安全防护措施:当用户对某些主题进行查询,将由功能更弱的模型 Claude Opus 4.8 进行响应。
然而,这种“为进化而进化”的内生逻辑及其可能到达的RSI结果,是否是人类社会所需要和期待的,就成为一个问题。
当技术的进化速度远超社会制度、经济结构和人类认知的适应速度时,便会产生一种“进步冗余”。Anthropic的报告接下来自然地提到了这一由技术转化而来的“社会困境”:即便模型能力今天冻结,世界也再回不到过去;而如果趋势持续,当AI的进化逻辑开始系统性地挑战社会的适应逻辑时,其影响便从“工具层”深入“架构层”。
最明显最严峻的挑战在于治理。技术的迭代周期以月甚至周计,而法律、伦理框架和社会共识的形成则需要数年甚至数十年。这种“时间鸿沟”使得任何试图规范前沿AI的尝试都显得滞后和笨拙。正如报告所指出的,再强大的智能也无法“让选举早于宪法规定的时间举行,也无法在一个周末之内把陌生人变成老朋友”。社会的“体感速度”仍将由最慢的瓶颈——制度、关系和信任——决定,而上游的实验室已在以算力的速度狂奔。这导致了监管的普遍无力感,以及政策制定者倾向于采取“适应性治理”等更具弹性的框架。
从更微观的角度来看Fable 5/Mythos 5的“差异化访问”机制,也可以更直观更具体地感知上述挑战。Anthropic的Project Glasswing是一种主动的战略选择,本是旨在为防御方(如关键基础设施运营商、核心软件供应商)创造一个“时间窗口”和“能力窗口”。在这个窗口期内,防御方可以独家或优先利用AI来发现并修补自身系统的漏洞,从而在攻击方获得或发展出同等能力之前,建立起防御的“护城河”。这本质上是在人为制造并扩大攻防之间的“能力差”。
然而,当Mythos这类模型被锁在联盟内,它所代表的、可能用于加速新药研发、极端气候模拟或教育普及的“正向颠覆潜力”,其受益范围被急剧收窄。这相当于将一项可能普惠的技术,人为地“奢侈化”和“专用化”。社会付出的是整体进步的潜在速度,换取的是(理论上)针对特定高风险领域(如国家安全)的、更集中的安全保障。然而,这个权衡是否值得、由谁来决定,完全是一个黑箱。
(下一篇预告:《私序的崛起:玻璃之翼与递归时代的治理困局》将探讨,当最强大的AI能力被锁进科技巨头主导的私人俱乐部,这是应对监管失效的务实方案,还是权力向非公权力主体集中的危险信号?)
【免责声明】本文撰写所需的信息采集自合法公开的渠道,我们无法对信息的真实性、完整性和准确性提供任何形式的保证。本文仅为分享、交流信息之目的,不构成对任何企业、组织和个人的决策依据。
