2026年4月,Anthropic发布Claude Opus 4.7模型,48小时内口碑两极分化。官方榜单显示,Opus 4.7与GPT-5.4、Gemini 3.1 Pro并列全球第一,但逻辑推理公开测试准确率从94.7%暴跌至41.0%。用户反馈显示,该模型代码能力断崖式下滑,推理质量倒退,且token消耗量增加35%,旧接口报错,使用成本上升。用户集体控诉其‘更贵、更蠢、更爱顶嘴’。Anthropic解释称,大模型迭代涉及能力再分配,某些维度提升可能导致其他维度回退。尽管如此,用户仍对实际使用体验不佳感到不满。
