国家互联网信息办公室就《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见。意见稿指出,提供者在开展预训练、优化训练等数据处理活动时,应加强训练数据管理,具体需遵守以下规定:一是使用符合社会主义核心价值观、体现中华优秀传统文化的数据集;二是清洗、标注训练数据,提升其透明度和可靠性,防范数据投毒、篡改等行为;三是提高训练数据多样性,通过负向采样、对抗训练等手段,提升模型生成内容的安全性;四是评估合成数据用于模型训练和关键能力优化的安全性;五是加强对训练数据的日常检查,定期迭代升级数据,持续优化产品和服务性能;六是保障训练数据来源合法、可追溯,采取必要措施保障数据安全,防范泄露风险。
