Anthropic于周二宣布启动“Project Glasswing”合作计划,向亚马逊、微软等合作伙伴开放其尚未发布的通用AI模型“Claude Mythos预览版”,用于防御性网络安全工作。该模型虽未专门针对网络安全训练,但凭借强大的编程和推理能力,已在软件中发现了“数千个”重大漏洞。它能够自主识别漏洞并开发利用代码。为防止模型被滥用,Anthropic采取了分阶段发布策略,仅允许合作伙伴和约40个关键软件基础设施组织访问,并承诺提供最高1亿美元的使用积分,同时向开源安全组织捐赠400万美元。参与组织需分享其发现成果。此次发布正值网络安全行业对AI驱动攻击的关注升温,Anthropic正与美国政府官员就模型能力进行持续讨论,此前该公司还曾与特朗普政府存在法律纠纷。
