OpenAI 推出全新方法 deliberative alignment,以提升 AI 模型安全性
2024-12-25

TechCrunch报道,OpenAI发布新研究,介绍确保AI推理模型与人类开发者价值观一致的新方法deliberative alignment,该方法提高了模型与公司安全原则的整体一致性,降低了回答不安全问题的比率。