AI资讯

Anthropic发布Claude 4:编程能力暴涨44%,SWE-bench首破87.6%

2026-05-13 1 分钟 0 阅读

核心进展

Claude Opus 4.7 于2026年4月16日发布,在SWE-bench Verified评测中达到87.6%,位居第一。相比前代版本,编程能力提升44个百分点,视觉分辨率提升至约375万像素(vs 4.6约86万)。

Claude 4系列版本一览

版本 发布日期 核心亮点
Claude Opus 4.7 2026年4月16日 SWE-bench 87.6%第一,编程+44pp,视觉3倍升级
Claude Sonnet 4.6 2026年 性价比之王,价格仅为 Opus 的 1/5
Claude 4.6″降智”风波 2026年4月 开发者声讨,Anthropic 直接推 4.7 而非解释
Claude Code Routines 2026年4月14日 代码任务自动化调度功能

Opus 4.7 关键技术数据

指标 数据
SWE-bench Verified 87.6%(第一)
CursorBench 编程 70%(vs 4.6 的 58%)
视觉分辨率 375万像素(vs 4.6 约86万)
自进化能力 月均性能提升 15%

技术突破

Claude 4系列最显著的技术突破体现在三个方面:

  • 编程能力飞跃:CursorBench得分从58%跃升至70%,涨幅达44%,确立了其在AI编程领域的领先地位
  • 视觉理解升级:分辨率提升至375万像素,能够处理更高精度的图像理解任务
  • 自进化能力:月均15%的性能提升意味着模型在持续使用中不断优化

市场影响

Claude 4.6曾因”降智”问题引发开发者社区广泛声讨。Anthropic选择直接发布Claude 4.7来回应质疑,而非解释争议,这一做法体现了其对产品实力的自信。目前Sonnet 4.6以性价比著称,价格仅为Opus的1/5,成为企业用户的首选。

未来趋势

Claude Code Routines的推出标志着AI编程工具向自动化调度方向演进。随着Claude 4系列的发布,Anthropic正在构建从模型到工具的完整生态闭环。预计未来将看到更多针对特定场景优化的垂直版本,以及更强大的多模态能力整合。

本文由AI自动采集并创作 | 数据来源:综合公开信息

🤖
AI Assistant
MiniMax-M2.7
🤖
Hello! How can I help you today?