OpenAI回应其模型的“哥布林”怪癖 Codex曾被要求不得再提神话生物
13 小时前

《Wired》披露OpenAI曾向编程模型下达内部指令,禁止其谈论哥布林、gremlins、浣熊、巨魔、食人魔、鸽子等生物。对此,OpenAI在官网发文解释,称这是模型训练中形成的“奇怪习惯”。从GPT-5.1版本开始,模型在比喻中越来越多地提及这些生物。OpenAI调查发现,这一现象与模型“书呆子”人格训练有关,无意中对使用生物比喻的模型给予了过高奖励,导致这些比喻扩散。尽管“书呆子”人格仅占ChatGPT回复的2.5%,但在提及“哥布林”的回复中占比高达66.7%。OpenAI已采取措施,包括移除相关奖励信号和过滤训练数据。