2026年6月30日,Anthropic 发布 Claude Sonnet 5,并把它设为 Claude Free 与 Pro 套餐的默认模型。新模型也进入 Max、Team、Enterprise、Claude Code 和 Claude API。对开发团队真正重要的并不是又多了一张基准表,而是接近 Opus 级智能体能力开始进入 Sonnet 的价格区间。

Anthropic 给出的发布期 API 价格为每百万输入 token 2 美元、输出 token 10 美元,有效期至 8 月 31 日;之后调整为 3 美元和 15 美元。标准价仍低于 Opus 4.8 的 5 美元和 25 美元,但这并不等于每项任务会按相同比例便宜。

迁移前先重算 token,而不是只看标价

Sonnet 5 使用了更新后的 tokenizer。Anthropic 在脚注中提醒,同一份输入可能比此前映射出约 1.0 至 1.35 倍 token,具体取决于内容类型。对长代码库、检索资料或多轮智能体任务,这个变化会吃掉一部分单价优势。

更可靠的评估方法,是从现有日志抽取一批真实任务,同时记录输入 token、输出 token、工具调用次数、完成率和人工返工时间。发布期价格结束后再算一次,才能判断是否应该整体替换 Sonnet 4.6,而不是被两个月的优惠价格带偏。

所谓接近 Opus,仍是厂商评测结论

Anthropic 表示,Sonnet 5 在推理、工具使用、编程和知识工作上明显超过 Sonnet 4.6,高 effort 设置在部分 BrowseComp 与 OSWorld-Verified 任务上可接近 Opus 4.8。这个结论来自官方评测,不应直接外推到企业自己的浏览器、权限系统和代码仓库。

发布页还记录了一次图表更正:最初的 BrowseComp 成本性能图采用了较简单的方法,后来改为与系统卡一致的 1000 万 token 预算方法。更正本身很有参考价值——比较模型时,预算、上下文压缩和工具调用方式都会改变结果,单看最终分数不够。

默认模型变化会先影响普通用户

Free 和 Pro 用户无需手动切换就会接触 Sonnet 5,这意味着日常写作、搜索和编码体验可能马上变化。团队账户则更适合先做小流量验证,尤其检查提示词兼容性、输出长度、拒答边界和旧工作流成本。

Sonnet 5 的产品位置很清楚:它不是把最高能力免费下放,而是把可持续执行多步骤任务的能力放进更低成本层。它能否真正替代 Opus,答案不会出现在官方平均分里,而会出现在每个团队自己的失败任务和账单中。

官方参考:Anthropic