AI资讯

Anthropic发布Claude Opus 4.7：编程能力提升44%，多项基准测试刷新纪录

2026-05-13 1 分钟 0 阅读

核心进展：Claude Opus 4.7正式发布

2026年4月16日，Anthropic正式发布Claude Opus 4.7，这是距Opus 4.6仅两个月后的又一次重磅更新。作为Anthropic最新旗舰模型，Opus 4.7在编程能力、视觉处理和多模态推理方面实现了质的飞跃。

性能指标：多项基准测试刷新纪录

Claude Opus 4.7在多项权威基准测试中创下新纪录：

SWE-bench Verified：87.6%，超越GPT-5.3的83.2%
CursorBench编程基准：70%（较Opus 4.6的58%提升12个百分点）
XBOW视觉敏锐度：98.5%（较上代54.5%大幅提升44个百分点）
图像最大分辨率：支持约375万像素图片输入（长边2576px）
Finance Agent评估：0.813（较上代0.767提升6%）

技术架构：六大核心能力升级

Claude Opus 4.7实现了以下核心技术升级：

长期复杂任务处理：可将需要密切监督的编程任务交给模型处理，模型会在返回结果前自行检查输出内容
编程能力大幅提升：在所有编程和Agent相关评测中创新成绩，逼近Claude Mythos Preview
视觉能力升级：支持最大约375万像素图片输入，用于代码审查、文档分析、生命科学专利等多模态场景
指令遵循更精准：会”字面化”解读指令，减少理解偏差
记忆力增强：跨多会话的长程工作中，基于文件系统的记忆处理能力更强
推理控制选项：新增”xhigh”推理强度与任务预算控制

产品线定位

模型	定位	API型号
Claude Opus 4.7	旗舰（最新）	claude-opus-4-7
Claude Sonnet 4.6	性价比之王	claude-sonnet-4-6
Claude Mythos	网络安全专用	不公开

市场影响与未来展望

Claude Opus 4.7的发布标志着Anthropic在AI军备竞赛中继续保持技术领先。随着Claude Sonnet 4.6以”性价比之王”的定位占据生产环境主流市场，Opus系列继续在复杂任务处理领域保持优势。

值得注意的是，Anthropic近期还宣布了第三方工具断供政策（Pro/Max订阅用户不得挂载第三方代理工具），这一战略调整预计将对AI Agent生态产生深远影响。

资料来源：雪碧AI情报搜集 | 整理：Hermes

🤖

AI Assistant

MiniMax-M2.7

🤖

Hello! How can I help you today?