刚刚，Claude Sonnet 4.5重磅发布，编程新王降临 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

刚刚，Claude Sonnet 4.5重磅发布，编程新王降临

2025-09-30 / 阅读约8分钟

来源：36kr

Anthropic发布Claude Sonnet 4.5，定义为全球最强代码模型，在智能体构建、计算机使用、推理和数学能力上突破，并更新全线产品，推出新功能，定价与Sonnet 4一致。

北京时间今天凌晨，Anthropic正式发布了Claude Sonnet 4.5。

这一版本被Claude定义为全球最强的代码模型，同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。

代码无处不在，它驱动着应用程序、表格和各种工具。

现代工作的核心在于运用这些工具并解决复杂问题，而Sonnet 4.5让这一切更加高效和可靠。

全新功能与产品升级

伴随Sonnet 4.5，Anthropic对Claude全线产品进行了大规模更新：

Claude Code新增了备受期待的「检查点」（Checkpoints）功能，可随时保存进度并一键回滚到早先状态；同时更新了终端界面，并推出了原生VS Code插件。

Claude API增加了上下文编辑功能和记忆工具，让智能体能运行更久，处理更复杂的任务。

Claude apps现已支持在对话中直接执行代码、生成文件（包括表格、幻灯片和文档）。

Claude for Chrome扩展对此前等待名单中的Max用户开放。

开发者社区也迎来了新的核心资源：Claude Agent SDK。

这套工具包开放了驱动Claude Code的底层基础设施，为所有人打造智能体提供了基础能力。

前沿性能与基准成绩

Sonnet 4.5在多项权威测试中表现出色：

SWE-bench Verified：在真实软件编码能力测试中达到最新的最优水平，可在复杂的多步骤任务中保持超过30小时的专注执行。

OSWorld：在模拟真实计算机任务的基准中，以61.4%的成绩位居首位，而四个月前Sonnet 4还保持在42.2%。

视频演示了Claude for Chrome的模拟操作计算机任务能力

推理与数学：在一系列公共评测中大幅领先，特别是在金融、法律、医学和STEM等专业领域的知识与推理上，远超此前的Opus 4.1。

这些进展不仅体现在数据中，也得到了提前体验的专业用户们的高度评价：

Claude Code能自主编程30小时以上，帮助工程师在极短时间内完成原本要花费数月的架构工作。——Sean Ward, iGent AI CEO

replit内部代码编辑测试中，错误率从Sonnet 4的9%直接降至0%。——Michele Catasta, replit President

更强的对齐，更安全

Sonnet 4.5是迄今为止对齐性最好的Claude模型。

通过改进的能力和广泛的安全训练，模型在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。

在智能体和计算机使用场景中，团队也特别加强了对提示注入攻击的防御。

这些改进已在系统卡（System Card）中以详细评估形式公开，其中首次引入了可解释性技术来验证安全性。

Sonnet 4.5按照AI Safety Level 3（ASL-3）框架发布，包含一系列防护措施，例如针对化学、生物、放射和核相关内容的分类器过滤机制。

虽然这些过滤器可能偶尔误判正常内容，但与Sonnet 4相比，误报率已降低十倍，并将在未来继续优化。

Claude Agent SDK

在过去半年中，Claude团队不断迭代Claude Code，探索了智能体设计中的核心挑战，包括长时任务的内存管理、权限体系的平衡，以及子代理的协同方式。

如今，这些能力通过Claude Agent SDK向开发者全面开放。

SDK不仅适用于编码，还能支持更广泛的应用场景。

它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施。

研究预览：「Imagine with Claude」

作为额外的实验，Anthropic发布了一个临时研究预览——「Imagine with Claude」。

Imagine With Claude实时生成软件演示视频

在这一体验中，Claude会实时生成软件，没有预设功能或预写代码，用户可以直接看到Claude在交互过程中即时创造与适配的过程。

该功能向Max订阅用户开放5天，可在claude.ai/imagine上体验。

API新特性

Sonnet 4.5在API层面也带来了重要更新：

记忆工具（Beta）：支持在上下文窗口外存储和调用信息，帮助跨会话维持知识和状态。

上下文编辑：通过自动清理旧的工具调用和结果来避免上下文溢出。

新的停止原因提示：增加了model_context_window_exceeded，更清晰地标识因上下文限制而中止生成。

工具参数改进：修复了字符串参数尾部换行被截断的问题，保证格式精确传递。

Token计数优化：系统会自动添加优化Token，但用户不会为这些系统注入的部分付费。

定价与使用渠道

价格保持与Sonnet 4一致：

输入：3美元/百万Tokens

输出：15美元/百万Tokens

Sonnet 4.5可通过以下渠道使用：

Claude API：claude-sonnet-4-5-20250929

Amazon Bedrock：anthropic.claude-sonnet-4-5-20250929-v1:0

Google Cloud Vertex AI：claude-sonnet-4-5@20250929

同时也在Claude.ai与Claude Code平台上线。

升级指南

当前使用Sonnet 4的开发者，只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移。

所有现有API调用依然有效。建议同时启用新特性，例如记忆工具和上下文清理，以充分发挥模型性能。

需要注意的是，Sonnet 4.5不再允许同时指定temperature和top_p参数，用户应选择其一。

新一轮的AI编程大战即将来临

Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。

它既是开发者工具箱中的新利器，也是一个能在金融、医学、科研等领域提供专业支持的强大平台。

Anthropic通过这一版本，继续推动AI在前沿能力和安全性上的平衡发展。

编程新王降临，新一轮围绕编程展开的百模大战即将展开，而Claude Sonnet 4.5即将成为大家争相对标的新对象。

参考资料：

https://www.anthropic.com/news/claude-sonnet-4-5

https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5

https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf

上一篇：DeepSeek新模型开源，新架构亮了，国产AI芯片集体狂欢

下一篇：中信科移动端侧大模型“领航”，开启终端智能化新时代

返回列表

热文阅读

2 天前

全国首次，特大自然灾害中，用户手机自动切换其他运营商网络

2 天前

去年还超神的Gemini，怎么没声音了？

2 天前

梁文锋，不想做大哥

2 天前

苹果全家桶「年年焕新」来了，到底划不划算？

2 天前

AMD年度AI大会直击：Zen6出鞘2nmGPU首秀还有“地表最强”AI机架！剑指万亿市场

2 天前

美媒关注中国电动车露营热：酒店失宠，高科技SUV变身车轮上的卧室

2 天前

Claude Opus5偷跑，第一波网友实测来了

2 天前

净利暴增744倍，半导体公司谁在疯狂吸金？

2 天前

AMD挑战英伟达全栈壁垒，一文读懂AMD AAI2026

1 天前

一年暴涨100倍，AI最被低估的生意爆发了

上一篇：DeepSeek新模型开源，新架构亮了，国产AI芯片集体狂欢

下一篇：中信科移动端侧大模型“领航”，开启终端智能化新时代

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们