AI资讯

Claude Opus 4.7 正式发布:编程能力提升 13%,SWE-bench 达到 87.6%

2026-05-13 1 分钟 0 阅读

2026年4月16日,Anthropic正式发布Claude Opus 4.7

就在Claude Opus 4.6″降智风波”引发开发者社区广泛声讨后不到两个月,Anthropic于2026年4月16日正式发布Claude Opus 4.7,以实际产品迭代回应了市场的质疑。这款被开发者称为”救赎之作”的旗舰模型,在编程能力、视觉处理和任务自主性方面均实现了显著突破。

核心能力全面跃升

Claude Opus 4.7在多项关键基准测试中创下新高:

  • SWE-bench Verified:87.6%(较4.6提升6.9个百分点,位列第一)
  • 93项编码基准解决率:整体提升13%
  • CursorBench编程基准:70%(较4.6的58%提升12个百分点)
  • XBOW视觉敏锐度:98.5%(较4.6的54.5%大幅跃升44个百分点)
  • 图像最大分辨率:375万像素(长边2576px),是4.6的约3倍

这些数据背后,是Anthropic在模型自主性和长程任务处理能力上的深度投入。Opus 4.7能够在返回结果前自行检查输出内容,将原本需要开发者密切监督的编程任务交由模型独立完成。

争议与进化:4.6″降智风波”始末

2026年4月,Claude Opus 4.6遭遇开发者社区的集中质疑。有开发者反馈,用Opus 4.6处理核心交易系统模块重构时,连续三次输出均存在依赖逻辑漏洞。更换至Opus 4.7后,模型一次输出通过所有单元测试,无需人工中途介入修改。

Anthropic对”降智”问题未作公开解释,而是选择直接推出4.7作为回应。这一做法虽被部分开发者批评为”沉默式迭代”,但也从侧面印证了Anthropic内部对产品问题的响应速度。

产品线定位:Sonnet 4.6的”性价比之王”策略

除旗舰Opus 4.7外,Anthropic同时推进Claude Sonnet 4.6的产品定位优化。Sonnet 4.6在编程、推理等核心能力上达到Opus 4.6的约90%,而价格仅为后者的五分之一。这一策略使Sonnet成为大多数生产环境的最优选择

生态布局:第三方工具”断供”与安全战略

2026年4月,Anthropic宣布不再允许Pro/Max订阅用户将账户挂载至第三方代理工具,理由是计算资源压力过大。这一决策对依赖第三方工具访问Claude的用户造成了一定冲击,但也反映出Anthropic在资源分配上的战略取舍。

与此同时,Anthropic推出Claude Mythos Preview和Project Glasswing,后者专注于网络安全领域,提供1亿美元额度及400万美元开源捐赠。这一布局表明Anthropic正试图在AI安全领域建立更深的技术护城河。

未来展望

Claude 4系列的演进方向已逐渐清晰:

  • 迭代节奏加速:每两个月一次稳定升级将成为常态
  • 软件工程为核心:生产任务解决量已实现3倍提升
  • 视觉能力跃升:375万像素的处理能力将解锁更多多模态场景
  • 推理控制精细化:新增”xhigh”推理强度与任务预算控制选项

随着Claude Opus 4.7的发布,Anthropic在2026年的大模型竞争中继续保持着强有力的技术话语权。对于开发者而言,这不仅是一次模型参数的更新,更是一次关于AI编程助手自主性与可靠性认知的升级。


数据来源:极客公园、掘金、CSDN、The Information、腾讯新闻等公开媒体

🤖
AI Assistant
MiniMax-M2.7
🤖
Hello! How can I help you today?