Claude Opus 4.6 深度拆解:ARC AGI 2 得分翻倍、百万 Token 上下文、Agent 团队协作——Anthropic 如何用一次「小版本更新」重新定义 AI 能力边界

Anthropic 于 2 月 5 日发布 Claude Opus 4.6,版本号仅从 4.5 升至 4.6,但性能跃迁堪称换代:ARC AGI 2 抽象推理得分从 37.6% 飙升至 68.8%,几乎翻倍;Terminal-Bench 2.0 编程基准创下 65.4% 历史最高分;BrowseComp 网络搜索能力从 67.8% 跃升至 84.0%。更关键的是,这是 Opus 家族首次支持百万 Token 上下文窗口和最高 12.8 万 Token 输出,并引入 Agent Teams 多智能体并行协作。价格不变、能力翻倍——这不是一次常规迭代,而是 Anthropic 向企业市场发起的全面进攻。

GitHub 发布 Agentic Workflows:用 Markdown 写自动化指令,AI Agent 每天帮你重构代码、分诊 Issue、维护文档——CI/CD 的下一个形态来了

GitHub 联合 Microsoft Research 推出 Agentic Workflows,开发者只需编写 Markdown 文件描述自动化意图,系统便会在 GitHub Actions 中调度 Copilot、Claude 或 Codex 等 AI Agent 自动执行代码简化、Issue 分诊、文档维护等任务。项目采用三层纵深防御安全架构,默认只读权限、沙箱隔离、Safe Outputs 机制确保 Agent 无法直接修改仓库。然而 Hacker News 社区的激烈讨论揭示了一个尴尬现实:Agent 自己的 PR 就出了问题——用错误方式处理依赖升级,审核者没发现就合并了。这场「Continuous AI」实验,正在重新定义开发者与自动化的边界。

16 个 AI Agent 两周造出 C 编译器:当「AI 软件工厂」从科幻走进现实,程序员该何去何从?

Anthropic 研究员 Nicholas Carlini 用 16 个 Claude Opus 4.6 实例在两周内自主构建了一个完整的 C 编译器,产出约 10 万行 Rust 代码,API 成本仅 2 万美元。这个编译器能编译 Linux 6.9 内核、PostgreSQL、Redis、FFmpeg,GCC Torture Test 通过率达 99%,甚至能编译运行 Doom。没有人类程序员参与编码,没有中央控制器,16 个 Agent 通过 Git 自行协调、分工、解决冲突。这不是一个 demo,而是一个信号:多 Agent 协作系统正在从「能写代码」跨越到「能造基础设施」。

从「看一眼」到「反复查」:Google Agentic Vision 如何让 AI 学会像侦探一样看图

Google 在 Gemini 3 Flash 中推出 Agentic Vision,将图像理解从一次性的「扫一眼」升级为 Think-Act-Observe 循环式主动调查。模型可以自主编写 Python 代码裁剪、缩放、标注图像,再基于处理后的视觉证据进行推理,视觉基准测试提升 5-10%。这不仅是一次技术升级,更标志着 AI 视觉从「被动感知」向「主动认知」的范式转变——AI 终于学会了「看不清就凑近看」。

7000 亿美元的豪赌:当 AI 军备竞赛吞噬科技巨头的现金流,泡沫还是远见?

Amazon、Alphabet、Meta、Microsoft 四大巨头 2026 年资本支出合计逼近 7000 亿美元,同比暴增 60%。但华尔街真正恐慌的不是数字本身,而是自由现金流的断崖式下跌——Amazon 可能出现 280 亿美元的现金缺口,Alphabet 自由现金流预计暴跌 90%,Meta 甚至在 2027-2028 年可能转为负值。当科技巨头集体从「印钞机」变成「烧钱机」,这场 AI 基建狂潮究竟是理性投资还是新一轮泡沫?

SaaS 末日论:一组 AI 插件如何在一天内蒸发 2850 亿美元,以及为什么这次恐慌可能只是开始

Anthropic 于 1 月 30 日发布 Claude Cowork 的 11 个行业插件,其中法律插件直接引爆市场恐慌——Thomson Reuters 暴跌 15%、LegalZoom 暴跌 20%、软件板块单日蒸发近 2850 亿美元。华尔街称之为「SaaS 末日」。但真正值得深思的不是一组插件的杀伤力,而是 AI 公司从「卖模型」到「吃掉应用层」的战略转向:当平台自己下场做垂直解决方案,整个 SaaS 生态的护城河还剩多少?

Alexa+ 全面开放:Amazon 用 2 亿台设备和 Prime 会员体系,打响语音助手的「第二次战争」

Amazon 本周正式向所有美国用户开放 Alexa+,Prime 会员免费使用,非会员每月 20 美元。这不只是一次产品升级——当 Alexa+ 搭载生成式大模型能力,覆盖超过 2 亿台 Echo 设备和数亿 Prime 会员时,语音助手赛道正在经历一场从「指令执行器」到「对话式智能管家」的根本性变革。Siri、Google Assistant 准备好了吗?