2026-W16 Overview
本周 AI 代码编辑器生态活跃,多个工具发布重要更新。Cursor 和 Windsurf 均推出了以代理协作为核心的版本升级,分别聚焦于自托管和命令中心。字节跳动新推出的 Trae IDE 以免费提供顶级模型为亮点进入市场。在 CLI 工具方面,Gemini CLI 发布了涵盖内存管理、技能修补的多版本更新,而 GitHub Copilot 则宣布了新的数据使用政策并增强了代码审查功能。整体来看,提升代理能力、增强隐私控制与模型集成是本周更新的主要趋势。
Editor Updates
Week-over-Week Overview
IDE
CLI / Plugin
IDE
Cursor
IDE- •支持自托管云代理,将代码和工具执行保留在自有网络中
- •代理窗口引入平铺布局和升级的语音输入功能
- •现在可以通过创建交互式画布来响应
Cursor 本周推出了自托管云代理功能,增强了数据隐私和控制。同时,代理窗口的界面得到改进,并新增了交互式画布响应能力。这些更新旨在提升开发者的代理工作流体验。
Windsurf
IDEv2.0.61- •发布 Windsurf Wave 4,据称是 IDE 发展的转折点
- •推出 Windsurf 2.0,引入代理命令中心和 Devin 集成
- •进行了多项错误修复和性能改进
Windsurf 本周发布了重要的 Wave 4 更新和 Windsurf 2.0,重点在于代理协作。更新包括新的代理命令中心、与 Devin 的集成以及一系列稳定性修复。这标志着其向更强大的多代理 IDE 迈进。
Trae
IDE- •字节跳动推出专为中国开发者设计的 AI IDE
- •提供对 GPT-4o 和 Claude-3.5-Sonnet 的免费无限访问
- •基于 VSCode 框架,具有现代化 UI 和插件兼容性
字节跳动本周正式推出了 Trae,这是一款面向中国市场的 AI IDE。它基于 VSCode,免费提供顶级 AI 模型,并具有 JetBrains Fleet 风格的现代化界面。此举旨在为本地开发者提供强大的免费编码工具。
Augment
IDEIntent 0.3.4, CLI 0.22.0- •Intent 0.3.4 重构了设置流程,使代理在内存压力下更具弹性
- •CLI 0.22.0 新增 /fork 命令用于复制会话,支持自定义主题
- •改进了终端标题清理,防止凭据泄露
Augment 本周发布了 Intent 和 CLI 的更新。Intent 0.3.4 专注于提升稳定性和用户体验,而 CLI 0.22.0 则增加了会话分叉和主题自定义等新功能。这些更新增强了工具的多代理协作和可定制性。
CLI
Claude Code
CLI / Plugin2.1.114- •npm 发布了多个版本(2.1.110 至 2.1.114)
- •修复了高 CPU 使用率、插件安装依赖项等多项问题
- •解决了技能执行中断、会话恢复显示错误等问题
Claude Code 本周通过 npm 频繁更新,发布了多个补丁版本。这些更新主要集中于修复各种错误,包括性能问题、插件管理缺陷和会话处理异常,以提升工具的稳定性和可靠性。
Gemini CLI
CLI / Pluginv0.38.2, v0.40.0-nightly, v0.39.0-preview- •发布了 v0.38.0 至 v0.40.0-nightly 之间的多个版本
- •新增 /memory inbox 命令用于审查提取的技能
- •更新计划模式提示,允许显示计划内容
- •增加了技能修补支持并与 /memory inbox 集成
- •修复了 Linux 沙盒以解决 ARG_MAX 崩溃问题
Gemini CLI 本周发布了大量更新,涵盖稳定版、预览版和夜间版。主要新功能包括内存管理(/memory inbox)、计划模式增强和技能修补。同时进行了多项核心、沙盒和策略控制的修复与改进。
OpenCode
CLI / Plugin- •变更日志显示增加了 LLM Gateway 作为提供商
- •修复了 Cloudflare AI Gateway 对 OpenAI 推理模型的支持
- •确保命令行上的 --agent 参数不会被会话保存的代理覆盖
OpenCode 本周更新了其变更日志,主要涉及后端集成和配置修复。新增了对 LLM Gateway 的支持,并解决了 Cloudflare AI Gateway 和代理参数处理中的一些问题,以提升连接稳定性和配置灵活性。
Aider
CLI / Plugin本周暂无重大更新
Copilot
CLI / Plugin- •GitHub 宣布自 4月24日起将使用 Copilot 交互数据训练模型
- •GitHub Copilot CLI 实验模式新增跨模型审查功能 "Rubber Duck"
- •GitHub Copilot CLI 现在支持 Copilot 自动模型选择
GitHub Copilot 本周发布了重要的政策公告和功能更新。从4月24日起,用户交互数据将用于模型训练(可退出)。同时,CLI 工具获得了自动模型选择和新的 "Rubber Duck" 代码审查功能。
CodeBuddy
CLI / Plugin2.91.0- •npm 发布了 2.91.0 等多个版本
- •2026年初升级的 2.0 版本引入了计划模式和支持 ACP 协议
- •提供基于腾讯元宝代码大模型的代码补全等服务
CodeBuddy 本周通过 npm 发布了版本更新。其 2.0 版本此前引入了计划模式和 ACP 协议支持等重大功能。作为腾讯云推出的 AI 代码助手,它持续提供基于大模型的编码服务。
Company Blogs
Canvases
Cursor 现在可以通过创建交互式画布来响应,增强了 AI 代理的可视化输出能力。
Tiled Layout and Upgraded Voice Input in the Agents Window
作为 Cursor 3 的一部分,本次发布改进了代理窗口界面,引入了平铺布局和升级的语音输入功能。
Windsurf 2.0: Introducing the Agent Command Center and Devin in Windsurf
Windsurf 2.0 引入了代理命令中心以及 Devin 的集成,旨在通过本地和云端代理的协作来提高开发效率。
Claude Opus 4.7 on AI Gateway
Anthropic 的 Claude Opus 4.7 现已登陆 Vercel AI Gateway。该模型针对长时间运行的异步代理进行了优化。
A new programming model for durable execution
文章探讨了用于持久化执行的新编程模型,旨在弥合原型与生产就绪系统之间的差距。
Coding Agents Ecosystem
High-signal items tagged coding-agents by the AI Daily pipeline this week — repos, tools, and writeups beyond the 10 tracked editors.
Donchitos/Claude-Code-Game-Studios
Donchitos/Claude-Code-Game-Studios:将Claude Code转变为完整游戏开发工作室,含49个AI代理和72个工作流技能
Claude Design
Anthropic发布Claude Design,专注于AI设计工具的新功能
thedotmack/claude-mem
Claude Mem:Claude Code插件,自动记录并压缩编码会话内容
Sources: Cursor in talks to raise $2B+ at $50B valuation as enterprise growth surges | TechCrunch
Cursor正洽谈以500亿美元估值融资20亿美元以上,企业业务快速增长
anomalyco/opencode
OpenCode:开源编码智能体项目
Show HN: Remoroo – Trying to fix memory in long-running coding agents
Remoroo工具解决长运行编码代理的记忆问题
SimoneAvogadro/android-reverse-engineering-skill
SimoneAvogadro/android-reverse-engineering-skill:Claude Code技能,支持Android应用逆向工程
The Pulse: ‘Tokenmaxxing’ as a weird new trend
讨论'tokenmaxxing'趋势及编码AI代理补贴可能结束等话题
ChromeDevTools/chrome-devtools-mcp
Chrome DevTools MCP:为编码智能体提供浏览器开发工具集成
Fission-AI/OpenSpec
Fission-AI 发布 OpenSpec,为 AI 编程助手提供规范驱动开发框架。
Thoughts and feelings around Claude Design
对Claude Design功能的用户体验分析和思考
czlonkowski/n8n-mcp
n8n MCP:为Claude等编码智能体构建n8n工作流的工具
Live Rank
| # | Model | Elo | Δ | Org |
|---|---|---|---|---|
| 1 | Claude Opus 4.7 | 1583 | — | Anthropic |
| 2 | Claude Opus 4.6 Thinking | 1549 | — | Anthropic |
| 3 | Claude Opus 4.6 | 1546 | — | Anthropic |
| 4 | GLM 5.1 | 1538 | — | Z.ai |
| 5 | Claude Sonnet 4.6 | 1525 | — | Anthropic |
| Model | Resolved % | Org |
|---|---|---|
| live-SWE-agent + Claude 4.5 Opus medium (20251101) | 79.2% | UIUC |
| Sonar Foundation Agent + Claude 4.5 Opus | 79.2% | Sonar |
| TRAE + Doubao-Seed-Code | 78.8% | ByteDance |
| live-SWE-agent + Gemini 3 Pro Preview (2025-11-18) | 77.4% | UIUC |
| Atlassian Rovo Dev (2025-09-02) | 76.8% | Atlassian |
| EPAM AI/Run Developer Agent v20250719 + Claude 4 Sonnet | 76.8% | EPAM Systems, Inc. |
| mini-SWE-agent + Claude 4.5 Opus (high reasoning) | 76.8% | Anthropic |
| ACoder | 76.4% | ACoder |
| mini-SWE-agent + Gemini 3 Flash (high reasoning) | 75.8% | Google DeepMind |
| mini-SWE-agent + MiniMax M2.5 (high reasoning) | 75.8% | Minimax |
| Model | Pass Rate | Δ |
|---|---|---|
| gpt-5 (high) | 88% | — |
| gpt-5 (medium) | 86.7% | — |
| o3-pro (high) | 84.9% | — |
| gemini-2.5-pro-preview-06-05 (32k think) | 83.1% | — |
| o3 (high) | 81.3% | — |
| Model | Pass@1 | Easy | Med | Hard |
|---|---|---|---|---|
| O4-Mini (High) | 87.3% | 98.4% | 92.7% | 71.1% |
| O3 (High) | 84.7% | 99.1% | 89.8% | 66.0% |
| O4-Mini (Medium) | 84.5% | 98.8% | 92.2% | 62.9% |
| DeepSeek-R1-0528 | 84.4% | 99.2% | 90.9% | 63.6% |
| Gemini-2.5-Pro-06-05 | 84.3% | 99.1% | 92.2% | 62.0% |
| Gemini-2.5-Pro-05-06 | 82.7% | 98.8% | 90.6% | 59.4% |
| OpenReasoning-Nemotron-32B | 81.0% | 98.6% | 87.5% | 57.5% |
| EXAONE-4.0-32B | 80.9% | 98.8% | 88.3% | 56.3% |
| Qwen3-235B-A22B | 80.4% | 99.1% | 88.8% | 54.0% |
| XBai-o4-medium | 80.1% | 98.8% | 90.1% | 52.0% |