清华团队与合作者推出大语言模型RealSafe-R1
2025-02-24

清华大学与瑞莱智慧联合推出的RealSafe-R1大语言模型,旨在提升安全性。该模型基于DeepSeek-R1系列进行后训练,实验证明其有效增强了对越狱攻击的抵抗力,缓解了安全与性能的矛盾。瑞莱智慧CEO田天宣布,RealSafe-R1模型及数据集将向全球开发者开源,为开源大模型的安全性加固提供助力,并为政务、金融、医疗等领域的应用提供坚实支撑。