Wednesday, May 13, 2026
**今日AI快报**:DeepMind衍生公司Isomorphic Labs融资21亿美元用于AI药物设计,同时OpenAI发布网络安全模型与Anthropic竞争。研究方面,TabPFN-3发布支持百万行的预训练表格模型,Auto-Rubric方法实现从隐式偏好学习显式标准。工具更新中,Thinking Machines发布原生交互模型TML-Interaction-Small,实现实时语音SOTA。观点洞察显示,有开发者成功在Game Boy Color上运行Transformer模型,而AI紧张局势正影响特朗普与习近平的会晤。
> Headlines & Launches
DeepMind衍生公司Isomorphic Labs融资21亿美元用于AI药物设计。
OpenAI发布网络安全模型,与Anthropic的Mythos竞争。
SAP投资AI自动化初创公司n8n,估值翻倍至52亿美元。
AI听写初创公司Wispr融资谈判估值达20亿美元。
AI生命科学公司Metis TechBio将在香港IPO。
Waymo因洪水事件召回3791辆Robotaxi修复软件。
> Research & Innovation
TabPFN-3发布:预训练表格基础模型,支持百万行
提出Auto-Rubric方法,从隐式偏好学习显式多模态生成标准。
将Q学习集成到基于溯源DAG的自进化记忆智能体中。
对33个前沿LLM进行领域级元认知监控分析。
提出分组技能检索方法用于智能体技能库。
研究VLM中可靠性的注意力、隐藏状态和因果电路机制。
从自由能视角区分后训练中的能力激发与能力创造。
提出自适应多粒度技能复用方法,降低LLM智能体成本。
提出共进化组合DAG方法增强工具增强型智能体。
通过因果证据研究LLM上下文学习中的图结构推断。
研究LLM在检索增强中能否批判性对待检索信息。
提出基于网格的空间启动方法提升LLM图表数据提取准确性。
提出富有表现力的口语语言模型,用于角色扮演和唱歌。
提出意图理解综合基准IntentGrasp。
提出多任务均衡学习检测器用于AI生成文本识别。
提出面向偏好的嵌入方法,用于集体决策。
提出多阶段框架优化人机协作成本效益。
提出多模态交互式语音工具调用对话助手用于智能家居。
探讨以人为中心的LLM研究方向与未来展望。
发现Transformer中MLP与注意力谱范数比值可预测几何稳定性。
提出孟加拉社交媒体标注中指令诱导标签崩溃的基准。
构建塔吉克-波斯语词汇资源及跨脚本低资源NLP混合模型。
> Engineering & Resources
AI编码Agent持久记忆库,基于基准测试
Thinking Machines发布原生交互模型TML-Interaction-Small,实时语音SOTA。
在Game Boy Color上本地运行真实Transformer语言模型。
工程师技能集,来自Claude配置目录
开源26M参数工具调用模型Needle,速度极快。
Luce DFlash/PFlash支持AMD Strix Halo,推理加速
Hugging Face开源ML工程师项目,可读论文、训练模型。
开源个人AI超级智能,注重隐私和强大
AI紧张局势笼罩特朗普与习近平的会晤。
MagicQuant v2.0发布:混合GGUF量化配置
llama.cpp新增llama-eval评估工具
antirez发布DeepSeek 4 Flash本地推理引擎,支持Metal。
分析中国高参与、开放优先的AI生态系统如何复合增长。
JEPA系列算法的最小化单文件实现,用于教育目的。
检测React代码问题的AI工具
AI公司数据中心需要更多非英伟达芯片的组件。
分析师称AI实际支出可能高于公开数据。
教程视频:从零构建Claude Code
对TranslateGemma字幕基准测试中评分结果的人工复查。
Statewright:用可视化状态机让AI代理更可靠。
Hypercubic为大型机和COBOL提供AI代理界面。
AI Agent分析平台,用于产品团队追踪
Thinking Machines Lab发布交互模型。
寻找LLM提供商风格的分层临时缓存测试软件。