2026-W20 Overview
本周 AI 编码工具领域迎来多项重要更新。Cursor 推出了云端代理开发环境并修复了安全漏洞;Windsurf 发布了 Wave 4 更新,引入 Claude Opus 4.7 快速模式和 Devin Review;Claude Code 和 Gemini CLI 也发布了多个版本,重点提升稳定性和代理功能。GitHub Copilot 桌面应用进入技术预览,Vercel 则推出了多项与 AI 和开发效率相关的新功能。整体来看,各工具都在强化 AI 代理能力和企业级特性。
Editor Updates
Week-over-Week Overview
IDE
CLI / Plugin
IDE
Cursor
IDE- •推出云端代理开发环境,支持多仓库、Dockerfile 构建和更强的安全控制。
- •Bugbot 新增 Effort Levels,团队管理员可自定义 PR 审查力度。
- •Cursor 现已集成到 Microsoft Teams。
- •修复了恶意 Git 仓库可能触发任意代码执行的安全漏洞。
Cursor 本周发布了多项重要更新,包括为 AI 代理提供云端开发环境、Bugbot 审查力度自定义、Microsoft Teams 集成以及安全漏洞修复。这些更新显著提升了代理的并行工作能力和企业级安全管控。
Windsurf
IDE- •Claude Opus 4.7(快速模式)现已可用,输出速度提升约 2.5 倍。
- •所有 IDE 用户均可使用 Devin Review 和 Quick Review。
- •Agent Command Center 新增收件箱列表视图和更快的会话处理。
- •修复了 Windows 更新问题及 MCP 服务器可靠性问题。
- •Devin 现已支持 Terminal,可作为 CLI 代理使用。
Windsurf 本周发布了 Wave 4 更新,重点引入了 Claude Opus 4.7 快速模式、Devin Review 和 Quick Review,并扩展了 Devin 到终端。这些更新显著提升了 IDE 的 AI 能力和审查效率。
Trae
IDE本周暂无重大更新。
Augment
IDEIntent 0.3.11- •工作区设置新增“Open in…”开关,可隐藏不用的编辑器。
- •终端侧边栏新增直接创建终端的按钮。
- •Notes 编辑器支持内联复选框快捷键。
- •修复了工作区最近使用时间戳不准确的问题。
Augment 发布了 Intent 0.3.11 版本,主要改进了工作区设置、终端管理和笔记编辑体验。这些更新提升了日常开发流程的便捷性。
CLI
Claude Code
CLI / Plugin2.1.143- •新增 `claude agents` 标志,扩展代理和后台会话选项。
- •快速模式默认更新为 Opus 4.7。
- •改进了插件依赖处理和后台会话可靠性。
- •修复了 WebFetch 挂起、macOS 休眠、Windows 和 CLI 稳定性等问题。
- •新增可点击的 [Image #N] 链接,可在默认查看器中打开图片。
Claude Code 本周发布了多个版本,重点更新了 Opus 4.7 快速模式、增强了代理和插件功能,并修复了大量稳定性问题。这些改进提升了 CLI 工具的可靠性和用户体验。
Gemini CLI
CLI / Pluginv0.44.0-nightly- •新增 RAG 片段导出到本地日志文件以辅助调试。
- •修复了企业网关上的凭据冲突问题,支持可选 API 密钥。
- •修复了 NixOS 等发行版上沙盒的权限拒绝问题。
- •修复了编辑窗口末尾换行符丢失的 UI 问题。
- •修复了 Git 环境中系统 PATH 丢失导致的 ENOENT 错误。
Gemini CLI 本周发布了多个 nightly 和预览版本,主要修复了企业认证、沙盒兼容性、UI 和 Git 环境等问题,并新增了 RAG 调试功能。这些更新提升了 CLI 的稳定性和跨平台兼容性。
OpenCode
CLI / Plugin- •支持一键安装,可选择 Claude、GPT-4、Gemini 等多种模型提供商。
- •新增 Plan 模式,可在构建前以只读方式规划复杂功能。
- •桌面应用 beta 版现已支持 macOS、Windows 和 Linux。
- •支持 LSP,自动为 LLM 加载正确的语言服务器。
- •支持会话分享链接,方便调试和协作。
OpenCode 作为一款免费开源的终端 AI 编码代理,本周持续受到关注。其亮点包括多模型支持、Plan 模式、桌面 beta 应用和 LSP 集成,为开发者提供了灵活的 AI 编码体验。
Aider
CLI / Plugin本周暂无重大更新。
Copilot
CLI / Plugin- •GitHub Copilot 桌面应用现已进入技术预览阶段。
- •支持从 Issue、PR 或提示开始代理开发会话。
- •团队级 Copilot 使用指标现可通过 API 获取。
- •GitHub 将从 2026 年 4 月 24 日起使用交互数据改进 Copilot。
GitHub Copilot 本周推出了桌面应用的技术预览,支持从实际工作场景启动代理开发。同时新增了团队级使用指标 API,为管理员提供更丰富的报告能力。
CodeBuddy
CLI / Plugin2.97.2- •腾讯云 CodeBuddy 现已生成超过 50% 的新代码。
- •90% 的腾讯工程师使用 CodeBuddy,编码效率显著提升。
- •通过自然语言调用 UI 库,半天即可完成核心编码。
CodeBuddy 本周发布了多个版本,其在腾讯内部的采用率持续增长,已生成超过 50% 的新代码。该工具通过自然语言编程大幅提升了开发效率。
Company Blogs
Development environments for cloud agents
Cursor 为 AI 代理推出了云端开发环境,支持多仓库、Dockerfile 构建、构建缓存和更强的安全控制,使代理能跨仓库推理和交付变更。
Cursor in Microsoft Teams
Cursor 现已集成到 Microsoft Teams,方便团队在协作平台中直接使用 AI 编码功能。
Bugbot Effort Levels
团队管理员和个人用户现可自定义 Bugbot 在 PR 审查中的努力级别,提供三种不同配置。
Opus 4.7 (fast mode) is now available in Windsurf
Claude Opus 4.7 快速模式现已在 Windsurf 中可用,提供完整的 Opus 4.7 智能和约 2.5 倍的输出速度。
Use native curl syntax with Vercel CLI
Vercel CLI 现支持原生 curl 语法,接受完整 URL、裸主机名和 --url 标志,并使用 Vercel 认证绕过部署保护。
Sort providers by cost, latency, or throughput on AI Gateway
AI Gateway 现可按成本、首字节时间或吞吐量对模型提供商进行排序,提供更明确的排名控制。
Protected Source Maps: Ship browser source maps securely
Vercel 推出受保护的 Source Maps,将浏览器 .map 文件置于 Vercel 认证之后,仅团队可获取,其他人返回 404。
Trusted Sources for Deployment Protection
Trusted Sources 允许受保护的部署接受来自 Vercel 项目和授权外部服务的短期身份令牌,无需共享长期密钥。
Create Vercel Firewall rules with natural language
Vercel Firewall 现支持使用自然语言创建 WAF 自定义规则,描述所需行为即可自动生成规则。
Fast mode for Opus 4.7 available on AI Gateway
Claude Opus 4.7 快速模式现已在 AI Gateway 上以研究预览形式提供,输出速度提升约 2.5 倍。
AI Gateway production index
Vercel 通过 AI Gateway 的生产数据,提供了对 AI 模型性能、成本和速度的独特行业视角。
Manage Vercel Firewall in the CLI
现可通过 Vercel CLI 直接管理 Firewall,包括自定义规则、IP 封锁、攻击模式等,并新增 Firewall 技能供代理使用。
Node.js 26.x now available on Vercel Sandboxes
Vercel Sandbox 现支持 Node.js 26.x 版本,开发者可通过升级 @vercel/sandbox 来使用。
Automate progressive rollouts with Vercel Flags
Vercel Flags 现支持渐进式发布,可按计划逐步向更多用户推出功能,不同于固定的加权拆分。
Coding Agents Ecosystem
High-signal items tagged coding-agents by the AI Daily pipeline this week — repos, tools, and writeups beyond the 10 tracked editors.
You can access Codex on your phone now - Axios
OpenAI将AI编程助手Codex引入ChatGPT手机应用。
affaan-m/everything-claude-code
Claude Code代理性能优化系统,包含技能、记忆和安全。
garrytan/gstack
Garry Tan的Claude Code配置:23个工具模拟CEO/设计师等角色。
Microsoft starts canceling Claude Code licenses
微软开始取消Claude Code许可证。
Claude Code's '/goals' separates the agent that works from the one that decides it's done | VentureBeat
Claude Code新增'/goals'功能,分离工作与决策。
huggingface/ml-intern
Hugging Face发布ml-intern:开源ML工程师,自动读论文、训练模型。
mattpocock/skills
工程师技能集,来自Claude配置目录
addyosmani/agent-skills
AI编码代理的生产级技能集合,提升代理能力。
colbymchenry/codegraph
预索引代码知识图谱,减少Claude Code的token消耗。
rohitg00/agentmemory
AI编码代理的持久记忆系统,基于基准测试。
decolua/9router
免费AI编码路由,连接多种代理到40+提供商。
earendil-works/pi
AI代理工具包:编码CLI、统一LLM API、TUI/Web UI库等。
anomalyco/opencode
开源编码代理,支持多种AI IDE集成。
Quoting James Shore
James Shore谈AI编码代理需降低维护成本。
Qoder Version 1.0 Released: Full Automation of Code Generation, Verification & Delivery - markets.businessinsider.com
Qoder 1.0发布,实现代码生成、验证和交付全自动化。
Speeding up local LLM for usable coding agent
讨论如何加速本地LLM以用于编码agent。
Codex is now in the ChatGPT mobile app
OpenAI的Codex现已集成到ChatGPT移动应用中。
Zerostack – A Unix-inspired coding agent written in pure Rust
Zerostack:一个受Unix启发的纯Rust编码代理。
millionco/react-doctor
检测React代码问题的AI工具
cline/cline
Cline作为自主编码Agent的SDK/IDE扩展/CLI助手发布。
Live Rank
| # | Model | Elo | Δ | Org |
|---|---|---|---|---|
| 1 | Claude Opus 4.7 Thinking | 1567 | — | Anthropic |
| 2 | Claude Opus 4.7 | 1559 | — | Anthropic |
| 3 | Claude Opus 4.6 Thinking | 1546 | — | Anthropic |
| 4 | Claude Opus 4.6 | 1541 | — | Anthropic |
| 5 | GLM 5.1 | 1532 | — | Z.ai |
| Model | Resolved % | Org |
|---|---|---|
| live-SWE-agent + Claude 4.5 Opus medium (20251101) | 79.2% | UIUC |
| Sonar Foundation Agent + Claude 4.5 Opus | 79.2% | Sonar |
| TRAE + Doubao-Seed-Code | 78.8% | ByteDance |
| live-SWE-agent + Gemini 3 Pro Preview (2025-11-18) | 77.4% | UIUC |
| Atlassian Rovo Dev (2025-09-02) | 76.8% | Atlassian |
| EPAM AI/Run Developer Agent v20250719 + Claude 4 Sonnet | 76.8% | EPAM Systems, Inc. |
| mini-SWE-agent + Claude 4.5 Opus (high reasoning) | 76.8% | Anthropic |
| ACoder | 76.4% | ACoder |
| mini-SWE-agent + Gemini 3 Flash (high reasoning) | 75.8% | Google DeepMind |
| mini-SWE-agent + MiniMax M2.5 (high reasoning) | 75.8% | Minimax |
| Model | Pass Rate | Δ |
|---|---|---|
| gpt-5 (high) | 88% | — |
| gpt-5 (medium) | 86.7% | — |
| o3-pro (high) | 84.9% | — |
| gemini-2.5-pro-preview-06-05 (32k think) | 83.1% | — |
| o3 (high) | 81.3% | — |
| Model | Pass@1 | Easy | Med | Hard |
|---|---|---|---|---|
| O4-Mini (High) | 87.3% | 98.4% | 92.7% | 71.1% |
| O3 (High) | 84.7% | 99.1% | 89.8% | 66.0% |
| O4-Mini (Medium) | 84.5% | 98.8% | 92.2% | 62.9% |
| DeepSeek-R1-0528 | 84.4% | 99.2% | 90.9% | 63.6% |
| Gemini-2.5-Pro-06-05 | 84.3% | 99.1% | 92.2% | 62.0% |
| Gemini-2.5-Pro-05-06 | 82.7% | 98.8% | 90.6% | 59.4% |
| OpenReasoning-Nemotron-32B | 81.0% | 98.6% | 87.5% | 57.5% |
| EXAONE-4.0-32B | 80.9% | 98.8% | 88.3% | 56.3% |
| Qwen3-235B-A22B | 80.4% | 99.1% | 88.8% | 54.0% |
| XBai-o4-medium | 80.1% | 98.8% | 90.1% | 52.0% |