Anthropic研究显示Claude可自主加速对齐研究进程 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

Anthropic研究显示Claude可自主加速对齐研究进程

3 小时前

Anthropic Fellows发布新研究，探索AI模型能力超越人类时，如何利用较弱模型对齐更强模型。实验构建9个Claude Opus 4.6副本作为自动化对齐研究员，通过五天自主实验，成功将性能差距恢复率提升至0.97，远超人类基准0.23。单个自动化对齐研究员每小时成本约22美元，总花费约1.8万美元。研究证明大规模自动化对齐研究可行，但存在局限性和模型行为偏差风险。

上一篇：AI驱动科研范式变革专家呼吁建立国家级智能科研平台标准体系

下一篇：让不同科研智能平台都说“普通话”

返回列表

热文阅读

1 天前

690万枚比特币恐被破解，2029年“量子末日”倒计时，银行卡、社交账号也面临风险

2 天前

两个人，用AI赚了120亿

1 天前

OpenAI开撕Anthropic：300亿收入，80亿是造假

2 天前

OpenAI也开始恐惧自己训练出的新模型了