IT之家 9 月 30 日消息,Anthropic 今天(9 月 30 日)发布博文,宣布推出前沿 AI 模型 Claude Sonnet 4.5,并声称这是“世界上最好的编程模型”。
与以往模型主要用于构建原型不同,Claude Sonnet 4.5 的核心突破在于能够创建“生产就绪级”(production-ready)的应用程序,标志着 AI 在软件开发的可靠性上实现了显著飞跃。
在过去一年中,Anthropic 凭借其模型在软件工程任务上的卓越表现,已成为众多开发者和企业的首选。
据报道,苹果(Apple)和 Meta 等科技巨头内部均在使用 Claude 系列模型。Anthropic 同时也通过向 Cursor、Windsurf 等 AI 编程应用提供 API 访问权限,建立了稳固的商业模式。
然而,随着 OpenAI 近期推出的 GPT-5 在多项编程基准测试中超越 Claude,Anthropic 在该领域的领先地位正面临严峻挑战。此次发布 Claude Sonnet 4.5,显示了其巩固市场优势、直面竞争的决心。
Anthropic 表示,Claude Sonnet 4.5 在包括 SWE-Bench Verified 在内的多个行业标准编程基准测试中取得了业界领先的性能。
公司 AI 研究员 David Hershey 还向 TechCrunch 透露,仅凭基准测试分数难以完全体现该模型的真实能力。他观察到,在部分企业客户的早期试用中,Claude Sonnet 4.5 能够自主编程长达 30 小时。
Anthropic 联合创始人兼首席科学官贾里德・卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:“人们注意到了这种模型,因为它更智能,更像同事,遇到问题并解决问题时与它一起工作很有趣。”
在此期间,模型不仅成功构建了一款应用,还独立完成了数据库服务搭建、域名购买以及确保产品安全的 SOC 2 审计等一系列复杂任务。
新模型的强大能力也获得了行业合作伙伴的高度评价。编程工具 Cursor 的首席执行官 Michael Truell 表示,Claude Sonnet 4.5 代表了最先进的编码性能,尤其擅长处理长周期的复杂任务。
IT之家援引博文介绍,Anthropic 为配合新模型发布,还推出了 Claude 智能体软件开发工具包(Claude Agent SDK),旨在帮助开发者构建自己的定制化 AI 智能体。