Anthropic公司宣布启动Project Glasswing(玻璃翼计划),该计划的核心是训练出全新超强模型Claude Mythos Preview,此模型正是前两天cc源码泄露事件中提及的模型,由12家机构共同发起。不过,该模型暂不向公众开放,其长期目标是让用户能够安全地使用具备同等能力的模型。目前,Anthropic计划先在Claude Opus模型上开发并验证安全防护机制。Claude Mythos Preview在扫描主流软件时发现了数千个零日漏洞,部分案例表明,该模型在发现和利用软件漏洞方面的能力超过了大多数人。Anthropic认为,AI技术降低了攻击成本,因此主动将其应用于防御领域。Project Glasswing计划分为两个层面实施:12家创始合作伙伴及40余家组织将获得模型的访问权限,Anthropic承诺提供1亿美元的使用额度,并将在研究预览期结束后明确商业访问的定价。此外,Anthropic还捐赠了400万美元,以支持开源软件的维护工作。后续计划包括信息共享和政策建议,各参与方将互通信息、发布研究进展报告,并与安全机构共同形成实践建议。
