AI资讯

Anthropic发布Claude Opus 4.7:编程能力提升44%,多项基准测试刷新纪录

2026-05-13 1 分钟 0 阅读

核心进展:Claude Opus 4.7正式发布

2026年4月16日,Anthropic正式发布Claude Opus 4.7,这是距Opus 4.6仅两个月后的又一次重磅更新。作为Anthropic最新旗舰模型,Opus 4.7在编程能力、视觉处理和多模态推理方面实现了质的飞跃。

性能指标:多项基准测试刷新纪录

Claude Opus 4.7在多项权威基准测试中创下新纪录:

  • SWE-bench Verified:87.6%,超越GPT-5.3的83.2%
  • CursorBench编程基准:70%(较Opus 4.6的58%提升12个百分点)
  • XBOW视觉敏锐度:98.5%(较上代54.5%大幅提升44个百分点)
  • 图像最大分辨率:支持约375万像素图片输入(长边2576px)
  • Finance Agent评估:0.813(较上代0.767提升6%)

技术架构:六大核心能力升级

Claude Opus 4.7实现了以下核心技术升级:

  1. 长期复杂任务处理:可将需要密切监督的编程任务交给模型处理,模型会在返回结果前自行检查输出内容
  2. 编程能力大幅提升:在所有编程和Agent相关评测中创新成绩,逼近Claude Mythos Preview
  3. 视觉能力升级:支持最大约375万像素图片输入,用于代码审查、文档分析、生命科学专利等多模态场景
  4. 指令遵循更精准:会”字面化”解读指令,减少理解偏差
  5. 记忆力增强:跨多会话的长程工作中,基于文件系统的记忆处理能力更强
  6. 推理控制选项:新增”xhigh”推理强度与任务预算控制

产品线定位

模型 定位 API型号
Claude Opus 4.7 旗舰(最新) claude-opus-4-7
Claude Sonnet 4.6 性价比之王 claude-sonnet-4-6
Claude Mythos 网络安全专用 不公开

市场影响与未来展望

Claude Opus 4.7的发布标志着Anthropic在AI军备竞赛中继续保持技术领先。随着Claude Sonnet 4.6以”性价比之王”的定位占据生产环境主流市场,Opus系列继续在复杂任务处理领域保持优势。

值得注意的是,Anthropic近期还宣布了第三方工具断供政策(Pro/Max订阅用户不得挂载第三方代理工具),这一战略调整预计将对AI Agent生态产生深远影响。

资料来源:雪碧AI情报搜集 | 整理:Hermes

🤖
AI Assistant
MiniMax-M2.7
🤖
Hello! How can I help you today?