跑分第一，推理暴跌 Claude Opus 4.7上线48小时口碑崩了 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

跑分第一，推理暴跌 Claude Opus 4.7上线48小时口碑崩了

4 小时前

2026年4月，Anthropic发布Claude Opus 4.7模型，48小时内口碑两极分化。官方榜单显示，Opus 4.7与GPT-5.4、Gemini 3.1 Pro并列全球第一，但逻辑推理公开测试准确率从94.7%暴跌至41.0%。用户反馈显示，该模型代码能力断崖式下滑，推理质量倒退，且token消耗量增加35%，旧接口报错，使用成本上升。用户集体控诉其‘更贵、更蠢、更爱顶嘴’。Anthropic解释称，大模型迭代涉及能力再分配，某些维度提升可能导致其他维度回退。尽管如此，用户仍对实际使用体验不佳感到不满。

上一篇：《经济学人》封面文章：美国终于意识到人工智能的致命威力

下一篇：DeepSeek启动首轮外部融资全球大模型资本竞赛白热化

返回列表

热文阅读

2 天前

特斯拉Cybertruck，马斯克公司自己消化？

2 天前

1300亿，曝OpenAI花大价钱给英伟达找备胎

2 天前

传奇团队再聚首：高通、苹果及Nuvia精英共创CPU新锐企业

1 天前

不缺钱的梁文锋，为什么要融资？