详读2万3千字的新“AI 宪法”之后 我理解了Anthropic的痛苦
7 小时前

2025年,Anthropic研究员Kyle Fish进行实验:让两个Claude模型自由对话,结果它们反复讨论自身是否有意识,对话甚至进入出现梵文术语、灵性符号的“精神喜乐吸引态”状态。该实验被多次复现,结果一致。2026年1月,Anthropic发布23000字的新宪法,由哲学家、AI安全研究员及天主教神职人员参与审阅。新宪法思路转变,不再仅告诉Claude该做什么,而是让其理解为什么,培养其判断力。