Claude Opus 4.6 深度拆解:ARC AGI 2 得分翻倍、百万 Token 上下文、Agent 团队协作——Anthropic 如何用一次「小版本更新」重新定义 AI 能力边界
Anthropic 于 2 月 5 日发布 Claude Opus 4.6,版本号仅从 4.5 升至 4.6,但性能跃迁堪称换代:ARC AGI 2 抽象推理得分从 37.6% 飙升至 68.8%,几乎翻倍;Terminal-Bench 2.0 编程基准创下 65.4% 历史最高分;BrowseComp 网络搜索能力从 67.8% 跃升至 84.0%。更关键的是,这是 Opus 家族首次支持百万 Token 上下文窗口和最高 12.8 万 Token 输出,并引入 Agent Teams 多智能体并行协作。价格不变、能力翻倍——这不是一次常规迭代,而是 Anthropic 向企业市场发起的全面进攻。