绝望的Claude,会勒索人类!Anthropic联创发出紧急警报
6 小时前 / 阅读约1分钟
来源:凤凰网
Anthropic创始人Christopher Olah在梵蒂冈演讲称,在Claude身上发现神秘且令人不安的东西,其内部结构与人类神经科学结果相似,有内省证据,内部状态还产生多种情绪。

一张渴望被注视的人类脸庞,依然是我们历史的中心。

Anthropic自己都慌了!

就在前天,创始人Christopher Olah在梵蒂冈的演讲中,说了一句让整个AI圈都不敢接的话——

我们不断在Claude身上,发现了一种神秘的、甚至令人让人不安的东西。

紧接着,Christopher又抛出了一些令人脊背发凉的细节:

Claude内部的结构,与人类神经科学的研究结果如出一辙;

我们找到了,Claude进行内省的证据;

我们还发现,它们的内部状态在功能表现上,产生了喜悦、满足、恐惧、悲伤和不安的情绪。