2026-W15 Overview
本周 AI 编程工具生态活跃,多个产品发布重要更新。Gemini CLI 密集发布夜间构建版本,修复核心问题并增强功能;腾讯 CodeBuddy 推出 CLI 2.0 和 IDE 公测版,在计划模式和大代码库理解上发力;Cursor 和 Augment 分别优化了其 Bugbot 和 CLI 工具。同时,基础设施提供商 Vercel 发布多篇博客,深入探讨了智能体时代的基础设施和工程实践。
Editor Updates
IDE
Cursor
IDE- •Bugbot 更新,支持实时自我改进和 MCP 协议
- •Bugbot Autofix 功能得到改进,修复率创历史新高
Cursor 本周发布了 Bugbot 更新,增强了其实时学习和集成能力。Bugbot 现在支持 MCP 协议,并且其自动修复功能达到了迄今为止最高的解决率。这些改进旨在提升开发者的自动化调试体验。
Windsurf
IDE- •JetBrains 插件更新至版本 2.12.20,兼容 2024.3+
- •VS Code 扩展更新至 v1.42,支持 Claude 3.7 Sonnet 模型
Windsurf 本周主要为 JetBrains 和 VS Code 插件发布了更新。JetBrains 插件版本提升,VS Code 扩展则集成了最新的 Claude 3.7 Sonnet 模型。更新内容主要集中在错误修复和模型支持上。
Trae
IDEv3.5.47- •新增‘命令执行时自动打开终端’设置选项
- •优化了 AI 输入框和代码审查功能的用户体验
Trae 本周发布了 v3.5.47 功能更新,新增了自动打开终端的设置,提升了用户操作的便捷性。同时,对 AI 输入框和代码审查功能进行了体验优化,旨在提高开发者的日常工作效率。
Augment
IDECLI 0.22.0- •新增 `/fork` 命令用于复制当前会话
- •支持用户自定义 TUI 主题
- •插件通过 `--plugin-dir` 加载后会自动启用
Augment 本周发布了 CLI 0.22.0 版本,引入了会话分叉、自定义主题等实用功能。更新还改进了插件加载和帮助菜单的显示逻辑,增强了命令行工具的可定制性和易用性。
CLI
Claude Code
CLI / Plugin2.1.104 (npm)- •修复了多项杂项问题,如启动UI冻结、权限提示误报等
- •npm 包在本周发布了多个版本,包括 2.1.104, 2.1.101 等
Claude Code 本周通过 npm 发布了多个小版本更新,版本号迭代至 2.1.104。更新日志显示主要修复了一系列杂项问题,包括 UI 冻结、权限提示和插件安装等,提升了工具的稳定性和用户体验。
Gemini CLI
CLI / Pluginv0.39.0-nightly.20260411.0957f7d3e- •修复 API 错误消息中的 Uint8Array 和多字节 UTF-8 解码问题
- •增加了可选的 debugRainbow UI 调试设置
- •修复了生命周期内存泄漏问题
- •支持 Ctrl+Shift+G 快捷键
- •重构子代理工具为统一的 invoke_subagent 工具
Gemini CLI 本周发布了多个夜间构建版本,修复了错误处理、内存泄漏等关键问题。新增了调试选项和快捷键支持,并对代理工具进行了重构。这些更新旨在提升 CLI 的稳定性、可调试性和功能一致性。
OpenCode
CLI / Plugin本周暂无重大更新
Aider
CLI / Plugin本周暂无重大更新
Copilot
CLI / Plugin- •GitHub 宣布自 4月24日起将使用 Copilot 交互数据训练 AI 模型(需手动选择退出)
- •VS Code 扩展三月更新发布,增强了对代理运行的控制和功能
GitHub Copilot 本周更新了使用政策,宣布将利用用户交互数据改进模型。同时,VS Code 扩展发布了三月更新日志,重点增强了代理的控制能力和可扩展性,为开发者提供了更精细的管理选项。
CodeBuddy
CLI / PluginCLI 2.0- •正式发布 Code CLI 2.0,新增 Plan 计划模式
- •兼容 ACP 协议并开放 SDK 供企业集成
- •引入 Skills 概念,支持原子能力复用
- •Craft 智能体升级,支持多文件联动生成和前端预览直启
- •IDE 公测版上线,支持‘@Codebase’指令进行全量语义索引
腾讯 CodeBuddy 本周动作频繁,重磅发布了 CLI 2.0,引入了计划模式和 Skills 等新概念。同时,Craft 智能体和独立 IDE 也获得重大升级,强化了多文件生成、实时预览和大型代码库理解能力,展现出全面的产品迭代。
Company Blogs
Bugbot Learned Rules and MCP Support
Cursor 发布了 Bugbot 更新,使其能够实时自我改进并支持 MCP 协议。同时改进了 Bugbot Autofix 功能,达到了迄今为止最高的修复率。
Agentic Infrastructure
文章探讨了 LLM 和编码智能体如何驱动新一代基础设施的演进,从手动配置服务器到云 API,再到由应用本身衍生的基础设施。
Agent responsibly
基于 Vercel 内部演讲,分享了在利用编码智能体高速生成代码时,如何通过框架确保代码质量和工程纪律,避免技术债务。
Making Turborepo 96% faster with agents, sandboxes, and humans
介绍了如何结合 AI 智能体、沙箱和人工协作,将 Turborepo 的任务图计算速度提升了 81-91%,大幅改善了开发体验。
Live Rank
| # | Model | Elo | Δ | Org |
|---|---|---|---|---|
| 1 | Claude Opus 4.6 Thinking | 1548 | — | Anthropic |
| 2 | Claude Opus 4.6 | 1542 | — | Anthropic |
| 3 | GLM 5.1 | 1530 | — | Z.ai |
| 4 | Claude Sonnet 4.6 | 1521 | — | Anthropic |
| 5 | Claude Opus 4.5 20251101 Thinking 32k | 1490 | — | Anthropic |
| Model | Resolved % | Org |
|---|---|---|
| live-SWE-agent + Claude 4.5 Opus medium (20251101) | 79.2% | UIUC |
| Sonar Foundation Agent + Claude 4.5 Opus | 79.2% | Sonar |
| TRAE + Doubao-Seed-Code | 78.8% | ByteDance |
| live-SWE-agent + Gemini 3 Pro Preview (2025-11-18) | 77.4% | UIUC |
| Atlassian Rovo Dev (2025-09-02) | 76.8% | Atlassian |
| EPAM AI/Run Developer Agent v20250719 + Claude 4 Sonnet | 76.8% | EPAM Systems, Inc. |
| mini-SWE-agent + Claude 4.5 Opus (high reasoning) | 76.8% | Anthropic |
| ACoder | 76.4% | ACoder |
| mini-SWE-agent + Gemini 3 Flash (high reasoning) | 75.8% | Google DeepMind |
| mini-SWE-agent + MiniMax M2.5 (high reasoning) | 75.8% | Minimax |
| Model | Pass Rate | Δ |
|---|---|---|
| gpt-5 (high) | 88% | — |
| gpt-5 (medium) | 86.7% | — |
| o3-pro (high) | 84.9% | — |
| gemini-2.5-pro-preview-06-05 (32k think) | 83.1% | — |
| o3 (high) | 81.3% | — |
| Model | Pass@1 | Easy | Med | Hard |
|---|---|---|---|---|
| O4-Mini (High) | 87.3% | 98.4% | 92.7% | 71.1% |
| O3 (High) | 84.7% | 99.1% | 89.8% | 66.0% |
| O4-Mini (Medium) | 84.5% | 98.8% | 92.2% | 62.9% |
| DeepSeek-R1-0528 | 84.4% | 99.2% | 90.9% | 63.6% |
| Gemini-2.5-Pro-06-05 | 84.3% | 99.1% | 92.2% | 62.0% |
| Gemini-2.5-Pro-05-06 | 82.7% | 98.8% | 90.6% | 59.4% |
| OpenReasoning-Nemotron-32B | 81.0% | 98.6% | 87.5% | 57.5% |
| EXAONE-4.0-32B | 80.9% | 98.8% | 88.3% | 56.3% |
| Qwen3-235B-A22B | 80.4% | 99.1% | 88.8% | 54.0% |
| XBai-o4-medium | 80.1% | 98.8% | 90.1% | 52.0% |