Claude Opus 4.7:全新旗舰 Opus 模型
Claude Opus 4.7 由Anthropic于 2026 年 4 月 16 日发布,专为要求最严苛的 AI 任务而设计。作为Claude Opus 4.6 的重大升级,新模型在软件工程、长期任务执行、指令遵循和视觉理解方面都提高了标准,同时还引入了一些重大 API 更改,开发人员需要为此做好准备。
Anthropic将其描述为“复杂、长期任务”的最佳选择,这些任务需要精确关注指令、自我验证以及在长时间会话中保持连贯的推理。
Claude Opus 4.7 的主要技术规格
- 上下文窗口:100 万个词元
- 最大输出:128,000 个词元
- 知识截止日期:2026年1月
- 分辨率:最高 2,576 像素(长边)/ 每张图像约 375 万像素
Claude Opus 4.7 的主要功能和改进
高级软件工程
Claude Opus 4.7 的主要改进是编码和代理软件任务的重大飞跃。根据 Anthropic 公布的基准测试表,Opus 4.7 在SWE-bench Verified得分 87.6%(Opus 4.6 为 80.8%),在 SWE-bench Pro 上得分 64.3%(Opus 4.6 为 53.4%)。这些进步表明,该模型在解决真实的 GitHub 问题、处理多文件代码库以及在没有人工干预的情况下完成多步骤调试循环方面有了显著的提升。
自我验证和指令遵循
其中一个更细微的改进是, Claude Opus 4.7 可以在报告结果之前验证自己的输出。实际上,这意味着模型在规划过程中更有可能发现自己的逻辑错误,而不是自信地给出错误的答案。这种行为通过更严格、更字面化的指令遵循得到加强,这是一把双刃剑(更多内容请参见“局限性”部分)。
升级的视觉能力
该模型将支持的图像分辨率提高了近三倍,从 1,568 像素(约 115 万像素)提高到 2,576 像素(约 375 万像素)。至关重要的是,图像坐标现在映射到实际像素位置,消除了早期版本中使计算机使用代理感到困惑的比例因子计算。这使得 Opus 4.7 在涉及密集型 UI、图表、示意图和屏幕截图的任务中更加可靠。
文件系统内存
Opus 4.7 改进了对基于文件系统的持久性内存的支持,即在一次会话中写入笔记,并在后续会话中检索它们的能力。结合用于草稿式推理的新“记忆工具”,这为更丰富的多会话工作流程打开了大门,模型可以随着时间的推移积累上下文。
Claude Opus 4.7 与其他模型对比
| 规格 | Claude Opus 4.7 | Claude Opus 4.6 | Claude Sonnet 4.6 | GPT-5.4 | Gemini 3.1 Pro |
| 速度 | 中等 | 中等 | 快 | 中等至快速 | 中等至快速 |
| 推理深度 | 非常高 | 高 | 高 | 非常高 | 非常高 |
| 编码能力 | 非常高 | 高 | 高 | 非常高 | 高 |
| 多模态支持 | 强 | 强 | 强 | 强 | 非常强 |
| 工具/agent工作流匹配度 | 极好 | 非常好 | 非常好 | 强 | 强 |
| 最适合 | 严谨推理、长编程任务、自主工作流 | 智能工作,生成前高级使用 | 一般专业用途 | 广泛的推理和一般性协助 | 多模态和多语言任务 |
常见问题解答
Claude Opus 4.7 的上下文窗口是多少?
Claude Opus 4.7 拥有 100 万个词元,每次响应的最大输出为 128,000 个词元。
Claude Opus 4.7 最擅长什么?
它在高级编码、复杂的、多步骤的任务、视觉工作和专业知识任务方面表现出色。Anthropic 表示,与早期的 Opus 版本相比,它在艰巨的工作中表现得更彻底、更一致。
Claude Opus 4.7 有助于编程吗?
是的。Anthropic 表示,它在高级软件工程和困难的编码任务方面尤其强大,在具有挑战性的基准测试和长时间运行的工作流程中表现更好。
Claude Opus 4.7 能处理复杂的工作流程吗?
是的。它专为代理工作流程而构建,涉及多种工具、规划、记忆和扩展任务执行,且需要较少的监督。Anthropic 表示,它比以往任何时候都能更可靠地处理工具故障。
Claude Opus 4.7 支持视觉任务吗?
是的。Anthropic 表示,它在视觉方面表现更强,包括文档分析和其他基于图像的任务。它还被描述为更擅长处理密集或复杂的视觉输入。


