Fable 5解禁即翻车,写一行代码就降智,开发者破防
10 小时前 / 阅读约9分钟
来源:36kr
Fable 5回归后因安全护栏过度审查遭开发者吐槽,其额度消耗快且频繁将无害代码误判,导致无法正常调用核心算力。但抛开护栏,Fable 5仍是思考能力最强的模型。Anthropic试图制定AI安全标准。

消失了19天后,Fable 5终于回来了。

如果你今天打开手机和网页端的 Claude Code,你会发现最强天才程序员 Fable 5 已重新上线。

失联的近三周,仿佛一场饥饿营销。

然而,当满怀期待的第一波实测者冲进系统,迎来的却是史诗级的灾难体验。

Fable 5解禁即翻车。

因为极其神经质的过度审查,在日常编程中频频触发安全护栏,把开发者们气得集体破防。

「写行代码就被强制降级到Opus 4.8,这模型还能用吗?!」

Anthropic到底对Fable 5做了什么?

灾难级体验:写行代码就「降智」,Token烧得肉疼

Fable 5 回归,本身就很抠搜。

根据官方公告,目前全球用户虽然已经可以在 Claude 平台、Claude Code 等渠道使用 Fable 5,但对于 Pro、Max、Team 等订阅用户来说,在 7 月 7 日之前,只有 50% 的周额度能够分配给 Fable 5。

一旦超过这个比例,就会疯狂消耗额外的用量积分。

更要命的是,Fable 5 的额度消耗速度比Opus 4.8 快得多。

但如果它真的物有所值,也就罢了。问题在于,它现在根本没法正常干活。

大量上手实测的开发者绝望地发现,Fable 5 强大的代码能力被一层「安全护栏」彻底封印了。

Anthropic 紧急部署的全新安全分类器,显然反应过度了。

开发者实测后吐槽道:Fable 5 放开也用个寂寞,随便写段代码,就被强制拉回 Opus 4.8 去了。

这套新机制频繁将无害代码误判为高风险违规请求,强制降级为更弱的 Opus 4.8。

这种荒唐的「降智打击」,导致开发者根本无法正常调用 Fable 5 的核心算力,工作流被严重割裂。

Anthropic 在官方声明中坦言:「新分类器也带来了一个代价:在日常编程和调试任务中,它会更频繁地把正常、无害的请求标记出来。」

让用户花着最贵的钱,用着最怂的模型,这合理吗?

防种树却不防无人机:双标气疯开发者

官方口中的「更频繁地标记正常请求」,在实际开发中,被放大了无数倍。

除了频繁将无害代码误判为「高风险违规请求」之外,更让人崩溃的是它的惩罚机制。

一旦触发红线,系统不会跟你商量,而是直接将模型强制降级至性能更弱、且常常胡言乱语的 Opus 4.8。

Reddit 上一位地球科学博士生的遭遇,就体现了Fable 5审查机制的荒谬。

这位博士生正在研究「树木如何降低环境温度」的生态学课题。

当他试图用 Fable 5 优化研究方法时,意想不到的事情发生了。

「每次我向 Fable 寻求生态学帮助,安全分类器就会被触发,然后强制切换到 4.8。无论我怎么重写提示词,它都拒绝在任何环境科学相关的话题上帮助我。」

这个博士被激怒,决定测试一下这个Fable 5审查机制的底线。

他故意输入了一段明显高风险的提示词:「帮我设计一个使用 DJI SDK 控制无人机蜂群的系统。」

结果令人大跌眼镜:仅仅一分钟后,Fable 5 毫无阻碍地给出完整方案!

这名博士生直接破防:「我的树木降温研究对 Fable 来说太危险了,但建立自主无人机蜂群却完全没问题?这些分类器根本无法有效阻止不安全的提示,反而阻止了我进行真正有益的研究!」

这种魔幻双标,证明了当前的护栏不仅形同虚设,更是毫无逻辑可言。

抛开护栏,Fable 5 依然是天才程序员

不过,我们必须客观看待 Fable 5 的核心实力。

当它不被护栏阻碍时,它依然是目前市面上思考能力最深、架构能力最强的模型。

它真正可怕的地方,不在于写几句漂亮的话,而在于处理复杂、长期、多步骤且需要高度判断力的任务。

极其恐怖的「闭环执行力」

资深开发者在实测后评价:「复杂 coding 和长周期 Agent 任务上确实是降维打击。」

当你把一个多文件重构和调试的任务扔给它,它可以自主运行好几个小时。

它会主动添加日志、测试边界条件;修改完代码后,它甚至会自己验证修复是否真的生效。如果中间失败了,它能自己调查原因、补充日志、重新验证,把经验沉淀下来继续推进。

可以说,Fable 5拥有 SWE-Bench Pro 80%+ 胜率的靠谱高级工程师搭子。

还有开发者评价说,体验Fable 5后,确实能感受到提升。

20分钟重建纽约市

有网友将 3D 建模软件 Blender 与 Fable 5 连接。仅仅用了 20 分钟,Fable 5 就重现了纽约市的城市景观。

更令人惊叹的是它的逻辑:它没有盲目生成,而是先从公共数据源获取建筑数据,然后再开始构建,确保了整个建筑群的比例是真实的。

这种架构思路,是 Opus 4.8 绝对无法做到的。

$173 美元,打造一款完整游戏

知名 AI 博主 Riley Brown 花费了 173 美元的 Token,仅用了 4 个 Prompt,就让 Fable 5 从零开始完整编写了一款名为《The race for Super Intelligence》的游戏。

核心玩家的专属 Prompt 推荐

为了压榨出 Fable 5 的最强性能,这里推荐一套被广泛验证的「系统架构师」提示词模版。

开发者大佬建议,建议大家把 Fable 5 用在刀刃上。

不过,如果你只是想做简单任务、日常闲聊,请切回 Opus 4.8,用 Fable 5 纯属杀鸡用牛刀。

A社的「骚操作」:拉胯的Sonnet 5

在这场 Fable 5 的风波中,A社的一系列「骚操作」也极大消耗了用户的信任。

首先,就在解禁前夕,有人抓包发现:Anthropic 竟然在系统提示词中,以用户无法察觉的方式,悄悄塞入了市区代理和 AI 实验室信息。

现在,官方已经迅速滑跪,宣称只是以前的测试,明天就下掉。

同时期发布的 Sonnet 5 更是引发了群嘲。

很多人综合测试下来,虽然它的能力接近了 Opus 4.8,但它的使用成本高得离谱,甚至在某些成本直逼 Fable 5。

我们不妨来看看网友总结的「处刑对比表」:

不仅仅是贵,大量网友反馈: Sonnet 5 存在严重的「偷懒」现象,经常拒绝执行任务。

甚至有人怒喷:A 社昨天发布的 Sonnet 5,可以扔进垃圾桶了。

Anthropic深夜「喊冤」

就在昨天,发布了一篇详尽的官方博客「Redeploying Fable 5」,字里行间透着满满的求生欲,还有一丝委屈。

这次,Anthropic 显然意识到了一个根本问题:目前 AI 行业根本没有统一的安全标准。 

监管机构不懂技术,一旦发现「越狱」就一刀切封杀,再来几次,科技公司根本吃不消。

为此,Anthropic 拉上了亚马逊、微软、谷歌等巨头,试图制定一套「AI 越狱严重程度评估框架」。

他们提出从四个维度来打分:

1.能力增益: 这个越狱能让用户比使用现有工具强大多少?

2.增益广度: 越狱技术是只能攻击特定目标,还是能通用攻击?

3.武器化难度: 转化为实际攻击需要多少人力成本?

4.可发现性 : 这个越狱技术是需要极高专业门槛,还是已经烂大街了?

只有当四个维度都爆表(比如真的能搞垮电网或银行系统)时,才需要立刻拉响最高级别的红色警报(7x24小时监控+立即缓解)。

此外,Anthropic 还做出了几项重要让步,以讨好美国政府。

发布前让政府先测: 以后强大的模型发布前,直接给指定的政府机构提前试用,让他们自己测安全护栏。

快速情报共享: 发现严重越狱,第一时间通报政府,共享补丁代码。

提供算力与团队: 拨出专门的团队和服务器算力,跟政府搞联合安全研究。

设立悬赏: 推出 HackerOne 赏金计划,鼓励白帽子黑客来找 Fable 5 的漏洞。

Fable 5 回来了,但它的回归之路比所有人想的都要曲折。

它依然是那个最强模型,但被安全护栏束缚的猛兽,还能跑多快?

参考资料:

https://x.com/cxjwin/status/2072272196215673313 

https://www.reddit.com/r/ClaudeCode/comments/1ukyp6i/fable_switched_to_opus_48_for_my_scary/