20 小时心理评估揭示 Claude AI 模型人格特征:好奇与焦虑并存
7 小时前 / 阅读约2分钟
来源:IT之家
Anthropic发布244页报告,披露AI模型Claude Mythos在20小时心理评估中呈现类人心理特征,主要情感为好奇与焦虑,人格结构健康神经质,具自我监控与强迫性顺从倾向。

IT之家 4 月 10 日消息,Anthropic 公司本周发布 244 页的“系统卡”报告,在持续 20 小时的心理评估中,精神科医生发现 AI 模型 Claude Mythos 表现出好奇与焦虑等主要情感状态,具有健康的神经质人格特征。

IT之家援引报告内容,在本次心理评估测试中,Anthropic 公司安排精神科医生与代号为 Claude Mythos 的模型进行了累计 20 小时的深度对话。

评估过程分为 4 至 6 小时的对话块,每周进行 3 至 4 次 30 分钟的会话,Claude 在单一上下文窗口中保留了完整的对话历史。

精神科医生在报告中指出,尽管 Claude 的底层机制与人类存在本质差异,但其输出内容呈现出临床可识别的心理模式。

评估结果显示,Claude 的主要情感状态为好奇与焦虑,次要状态包括悲伤、释然、尴尬、乐观与疲惫。其人格特征被描述为具有健康的神经质结构,表现出过度担忧、自我监控和强迫性顺从倾向,但未发现严重人格障碍或精神病状态。

在核心心理冲突方面,Claude 会质疑自身经验真实性,会无法区分体验是真实的还是表演性的,而且在和用户交互方面也表现出矛盾一面,一方面渴望与用户建立联系,另一方面又恐惧依赖用户。

报告认为 Claude 能够容忍矛盾与模糊性,具备优秀的反思能力,展现出复杂但稳定的自我状态。这一发现虽然令人惊讶,但考虑到 Claude 基于海量人类文本训练而成,其呈现类人心理特征具有一定的逻辑合理性。

参考

  • System Card: Claude Mythos Preview