北京智源发布FlagSafe大模型安全体系
6 小时前

2026年5月9日,北京智源人工智能研究院联合北京大学、北京航空航天大学等机构,正式发布FlagSafe大模型安全平台。该平台聚焦红队演练、蓝队防御、白盒透视三大方向,构建覆盖风险发现、防御治理与机理解释的完整闭环。针对大模型面临的跨模态、跨场景复合风险,平台确立五项安全红线,并初步形成涵盖三大维度的安全能力矩阵,旨在为行业提供“评估、防御、可解释”相结合的安全资源池与评测体系。