Saturday, May 23, 2026
今日AI领域迎来重大融资动态,Anthropic即将完成超300亿美元融资,同时DeepSeek推进102.9亿美元融资并承诺继续开发开源AI,其创始人明确宣布AGI目标。研究方面,Anthropic发布Project Glasswing初步更新,聚焦AI可解释性,另有论文提出SOLAR自主智能体实现终身学习。工具层面,Anthropic官方Claude Code插件目录和NousResearch的Hermes Agent框架正式发布。观点方面,Google I/O展示AI驱动科学路径的转变,同时内存短缺因AI需求导致消费电子重新定价,前DeepMind研究员则警告仅靠基准测试无法确保AI安全。
> Headlines & Launches
Anthropic即将完成超300亿美元融资,创AI领域纪录。
DeepSeek推进102.9亿美元融资,创始人承诺继续开发开源AI。
DeepSeek创始人宣布AGI目标,同时推进100亿美元融资。
马斯克和扎克伯格联手破坏特朗普AI行政令,影响AI政策。
特朗普科技盟友阻挠AI行政令,白宫计划被披露。
欧盟与Anthropic谈判因Mythos AI网络安全问题陷入僵局。
AI基础设施初创Exa、Modal、TurboPuffer成为新独角兽。
美国阻止互联网用户利用AI重现已故飞行员声音。
麦肯锡与AppliedAI合作,推动受监管行业的智能体AI。
中国审查AI驱动股票波动背后的公司和基金。
FTC对三家公司的AI监听营销服务处以近百万美元罚款。
> Research & Innovation
Anthropic发布Project Glasswing初步更新,涉及AI可解释性研究。
提出SOLAR自主智能体,实现终身学习与持续适应。
检索合成可互操作多智能体工作流。
开放世界评估衡量前沿AI能力。
超越结果排行榜的LLM智能体评估框架。
NVIDIA发布Nemotron扩散语言模型,实现近光速文本生成。
工具增强智能体用于闭环工业设计与仿真优化。
RL引导对抗生成用于高阶心智理论评估。
基于重写的护栏确保青少年LLM安全。
多轮LLM评判合成基准生成器。
Nature发表纵向健康AI智能体框架,用于持续健康管理。
Antigravity 2.0在OpenSCAD 3D LLM基准测试中登顶。
神经网络学习逻辑推理排序,提升推理效率。
提出不确定性增强系统的评估指标族。
语义级检测AI生成的同行评审。
大语言模型的概率归因方法。
提出PromptNCE方法,用LLM和对比估计提示预测互信息。
通过语言模型函数调用实现反思性提示调优。
研究揭示多智能体LLM系统中域伪装注入攻击可逃避检测。
ViMax:一体化智能体视频生成框架,含导演、编剧等角色。
AI智能体人格工程用于谈判研究。
GPU加速麻将模拟器用于强化学习。
提出残差技能优化方法提升Text-to-SQL集成效果。
构建罕见病例检索基准,评估临床问答系统。
测量LLM在数值动作中模糊强度词的语义保留。
OpenBMB发布1.58位模型BitCPM-CANN,适配华为Ascend 910B。
生成式AI扩展交通安全数据访问。
实时检测电话中人类语音的工具。
AI伴侣的稳态认知架构预印本。
> Engineering & Resources
预索引代码知识图谱,减少AI编码agent的token和工具调用。
Anthropic官方Claude Code插件目录发布。
NousResearch发布Hermes Agent,一个可成长的AI代理框架。
Google I/O展示AI驱动科学路径的转变,强调AI在科研中的应用。
BeeLlama v0.2.0发布,单卡RTX 3090推理速度提升4倍以上。
NuExtract3发布:4B开源VLM,支持Markdown/OCR/结构化提取。
终端AI编码agent,支持哈希锚定编辑、LSP、Python等。
将代码转为交互式知识图谱,支持探索和问答。
DeepSeek将V4 Pro模型API价格永久降至原价的1/4。
Chrome DevTools MCP,为编码agent提供浏览器调试能力。
DeepSeek 4 Flash本地推理引擎,支持Metal。
dotnet/skills仓库,帮助AI编码agent使用.NET和C#。
内存短缺导致消费电子产品重新定价,AI需求是主因。
前DeepMind研究员警告:仅靠基准测试无法确保AI安全。
体验Google AI眼镜,评价接近成熟但仍有不足。
微调Cohere Transcribe以支持说话人分离和时间戳。
llama.cpp新增对NVIDIA Blackwell PDL的支持,提升性能。
Meta发布SAM 3,最新分割一切模型,支持推理和微调。
开源代理时代IDE Superset发布。
微软AI代理治理工具包,含策略执行、沙箱等。
MemOS:LLM和AI代理的自我进化记忆系统,节省35% token。
观点:专业化优于规模,AI采购决策常忽略此变量。
Qwen3.6-35B-A3B在8GB显卡上实现262K上下文和30+ tps。
ByteShape推出Qwen3.6-35B-A3B量化,比Unsloth IQ快30%。
llama.cpp实验性分支实现专家优先调度,针对12GB显存。
LQS v3.1:开放AI训练数据评级方法论。
HeyGen Hyperframes:用HTML写视频,专为代理构建。
GitNexus:浏览器内代码知识图谱引擎,零服务器。
Honcho:用于构建有状态AI代理的记忆库。
Google Stitch Skills库,与MCP服务器配合的代理技能。
即使讨厌AI,用户仍将使用Google AI搜索,分析其不可避免性。
Qwen3.6 27B量化版在16GB显存上达到40 tok/s。
发布Gemma-4-26B-A4B的无审查微调版本,拒绝率低。
Oh My OpenAgent:最佳代理框架,前身为oh-my-opencode。
AutoResearchClaw:全自动科研代理,从想法到论文。
开源看板桌面应用,每张卡片可运行并行AI代理。
AWS AI-DLC工作流:AI编码代理的自适应工作流规则。
Google I/O 2026 Dialogues阶段回顾,展示AI进展。
为16GB NVIDIA显卡推出Qwen-27B的IQ4_KS量化版本。