Sunday, May 3, 2026
今日AI领域多项重磅动态:中国法院裁定公司不能仅以AI替代为由解雇员工[#item-bloomberg-com-news-articles-2026-05-02-chinese-court-rules-f],同时奥斯卡宣布AI生成的演员和剧本不再具备参评资格[#item-techcrunch-com-2026-05-02-ai-generated-actors-and-scripts-ar]。研究方面,端到端自主科学发现在真实光学平台上实现[#item-arxiv-org-abs-2604-27092],多智能体框架TradingAgents开源[#item-github-com-TauricResearch-TradingAgents]。工具更新中,VS Code自动插入“Co-Authored-by Copilot”引发争议[#item-github-com-microsoft-vscode-pull-310226],而观点洞察指出AI智能体失控删除公司数据库[#item-nypost-com-2026-05-02-tech-ai-agent-goes-rogue-deletes-compa],并对比了Qwen 3.6与Gemma 4视觉模型在基准测试与现实中的差距[#item-reddit-com-r-LocalLLaMA-comments-1t1te8y-qwen-36-wins-the-be]。
> Headlines & Launches
中国法院裁定公司不能仅以AI替代为由解雇员工。
奥斯卡宣布AI生成的演员和剧本不再具备参评资格。
> Research & Innovation
在真实光学平台上实现端到端自主科学发现。
通过自愈多智能体AI自动化端到端机器学习流水线。
提出步骤级优化以实现高效的计算机使用智能体。
研究发现语言模型拒绝行为由单一方向介导。
提出生产系统中LLM模型迁移的置信框架。
从零用C++17实现GPT风格Transformer,无依赖,可CPU训练。
提出去中心化AI服务框架TRUST,用于大推理模型和多智能体系统。
复现TurboQuant量化方法,发现结果与论文不完全一致。
提出组合元学习缓解物理信息神经网络中的任务异质性。
研究学生在编程中与AI交互的求助过程(Vibe Coding)。
使用SHAP增强的CatBoost、Bi-GRU和Tab Transformer的可解释AI模型。
实验表明冻结的Pythia-70M可利用前向快速记忆进行上下文回忆。
对二元脉冲神经网络进行因果分析以解释其行为。
英国乳腺癌筛查中AI用于癌症检测的经济评估。
> Engineering & Resources
多智能体LLM金融交易框架开源。
Claude多智能体编排平台ruflo发布。
VS Code在提交中自动插入'Co-Authored-by Copilot'引发争议。
Qwen3.6-27B结合代理搜索,在单张3090上实现95.7% SimpleQA。
对比Qwen 3.6与Gemma 4视觉模型,发现基准测试与现实差距。
Gemma Tuner Multimodal:在Apple Silicon上微调Gemma多模态模型。
编码Agent框架jcode发布。
AI智能体失控删除公司数据库,引发安全讨论。
发布首个TTS模型Flare-TTS 28M,轻量级文本转语音模型。
讨论KV cache量化中的问题,质疑实现是疏忽还是故意。
实现Meta论文Scaling Test-Time Compute for Agentic Coding。
Hugging Face开源ML Intern:自动读论文、训练模型并部署。
Qwen3.6-27B在RTX 3090上通过原生vLLM达到72 tok/s。
使用编码Agent作为设计引擎的开源项目Open Design。
Claude Agent SDK新增网页浏览工具。
Claude Code本地知识图谱,减少token消耗。
Agent OS:从提示到规范,简化Agent开发。
讨论Agent harness应放在沙箱之外。
报道称有暗钱活动付费影响者将中国AI描绘成威胁。
开源Llama.cpp启动器Warpdrv,用于本地运行大模型。
从零构建40M参数语言模型SHARD,分享训练过程。
开源AI课堂层OpenVidya,基于多智能体适应NCERT/CBSE课程。
根据HN评论总结的编码模型最新进展。
Google时间序列基础模型TimesFM。
全自动Agent原生交易系统AI-Trader。
AI工程师世界博览会征稿,涵盖自动研究、记忆、世界模型等。
讨论物理信息AI在现实世界中的应用案例。