Intelligence.Log

Tuesday, April 28, 2026

Extracted: 67 items. Sources: 33. Filter: Score >= 5.0
++ Daily.Brief ++

今日AI领域迎来重大变动,微软与OpenAI终止独家及收入分成协议,双方著名的AGI协议也随之失效,OpenAI重获自由。在研究方面,微软开源了40亿参数的图像转3D模型TRELLIS.2,同时新论文指出基于结果的奖励无法保证可验证推理。工具更新上,微软开源了前沿语音AI VibeVoice,并有项目提供免费使用Claude Code的途径。观点洞察中,业界正追踪已失效的AGI条款历史,并讨论生产级RAG系统的局限性,以及AI在物理世界中的应用。

> Headlines & Launches

微软与OpenAI终止独家及收入分成协议。

HN (747)#openai #microsoft #partnership[Model Release]

微软与OpenAI的AGI协议终止,合作关系重新谈判。

theverge.com#openai #microsoft #agi[Model Release]

OpenAI打破与微软的AI独家协议,重获自由。

bloomberg.com#openai #microsoft #exclusivity[Model Release]

DeepMind David Silver融资11亿美元构建无人类数据学习AI。

techcrunch.com#funding #deepmind #unsupervised-learning[Model Release]

马斯克与奥特曼就OpenAI未来展开法庭对决。

theverge.com#openai #lawsuit #governance

马斯克与奥特曼对簿公堂,决定OpenAI未来走向。

arstechnica.com#openai #lawsuit #governance

彭博播客报道OpenAI与微软分道扬镳。

bloomberg.com#openai #microsoft #podcast[Model Release]

马斯克与奥特曼就OpenAI未来对簿公堂。

technologyreview.com#openai #lawsuit #governance

AI承包商Mercor泄露4TB语音样本和身份证扫描件。

HN (436)#data-breach #privacy #ai-contractors

中国阻止Meta收购AI初创公司Manus,涉及国家监管与AI竞争。

HN (299)#acquisition #regulation #china

Meta 20 亿美元收购 Manus 被中国发改委阻止

Reddit r/LocalLLaMA#acquisition #regulation #meta

GitHub Copilot将改为按用量计费。

HN (541)#github-copilot #billing #ai-coding[Coding Agents]

欧盟要求谷歌开放安卓AI助手市场,谷歌称其过度干预。

arstechnica.com#regulation #android #ai-assistant

DeepMind与韩国合作加速前沿AI科学突破。

DeepMind#partnership #deepmind #korea

> Research & Innovation

证明基于结果的奖励不能保证可验证或因果重要的推理。

ArXiv cs.CL#rlvr #reasoning #chain-of-thought[Post-Training]

提出带类型语义记忆和信息论检索的长时域智能体。

ArXiv cs.AI#agent #memory #long-horizon[Context Engineering][Agent Harness]

新AI框架自主优化训练数据、架构和算法,超越人类基线。

venturebeat.com#automl #optimization #framework

Qwen3 4B在代码任务上超越云agent,Mahoraga研究。

Reddit r/MachineLearning#qwen #code-agents #open-source[Coding Agents]

提出测试LLM在对话中涌现数学推理能力的基准。

ArXiv cs.AI#llm #reasoning #benchmark[Evals]

提出具有分层技能的自主智能体用于药物分子评估与优化。

ArXiv cs.AI#agent #drug-discovery #hierarchical-skills[Agent Harness]

提出AI战略推理风险的分类评估框架。

ArXiv cs.AI#llm #reasoning #risk[Evals]

用控制论诊断LLM自我纠正何时有效并提出先验证策略。

ArXiv cs.AI#llm #self-correction #control-theory[Planning]

定义并研究视觉语言模型中的源模态监控能力。

ArXiv cs.CL#multimodal #vision-language #monitoring

通过强化学习激励VLM中的神经符号语言推理。

ArXiv cs.CL#reinforcement-learning #vlm #neuro-symbolic[Post-Training]

4B 参数模型基准测试,对比不同模型性能

Reddit r/LocalLLaMA#benchmark #small-models[Evals]

提出基于工件的智能体框架用于自适应医学图像处理。

ArXiv cs.AI#agent #medical-imaging #framework[Agent Harness]

使用LLM智能体复现社会科学研究结果。

ArXiv cs.AI#llm #agent #social-science[Agent Harness]

强调科学智能体需要对抗性实验来验证可靠性。

ArXiv cs.AI#agent #adversarial #science[Agent Harness]

引入背景温度概念刻画LLM中隐藏的随机性。

ArXiv cs.AI#llm #randomness #temperature

发现共享词汇任务表征解释LLM行为变异性。

ArXiv cs.CL#llm #behavior #representation

提出轻量级RAG和LLM用于可扩展的患者-试验匹配。

ArXiv cs.CL#rag #llm #healthcare[Context Engineering]

研究LoRA在混合语言模型中的组件类型放置。

ArXiv cs.CL#lora #hybrid-models #fine-tuning

研究LLM检测文化特定健康错误信息的局限性。

ArXiv cs.CL#llm #misinformation #health

为乌克兰语本地部署优化的端到端RAG系统。

ArXiv cs.CL#rag #ukrainian #local-deployment

知识驱动的增强与检索用于整合时间适应。

ArXiv cs.CL#temporal-adaptation #retrieval #knowledge-augmentation

研究如何从大量题库中为精神科对话选择最优问题。

ArXiv cs.CL#clinical #question-selection #nlp

物理信息驱动的自适应超声成像AI模型。

Hugging Face#ultrasound #physics-informed #medical-ai

> Engineering & Resources

面向工程师的AI技能集,来自Claude Code配置。

GitHub trending:all (+5645★)#ai-coding #skills #claude-code[Coding Agents]

微软开源前沿语音AI VibeVoice。

GitHub trending:all (+757★)#voice-ai #open-source #microsoft[Model Release]

免费使用Claude Code的终端/VSCode扩展。

GitHub trending:all (+2949★)#claude-code #free #vscode[Coding Agents]

开源Agent在TerminalBench上超越谷歌官方模型。

HN (302)#open-source #agent #benchmark[Coding Agents][Evals]

追踪微软与OpenAI已失效的AGI条款历史。

Simon Willison#openai #microsoft #agi

Luce DFlash: Qwen3.6-27B 在单张 RTX 3090 上实现 2 倍吞吐量

Reddit r/LocalLLaMA#speculative-decoding #qwen #inference

Gemma Tuner Multimodal:在Apple Silicon上微调Gemma多模态模型。

Co-Starred#gemma #fine-tuning #multimodal[Post-Training]

GitNexus:零服务器代码智能引擎,客户端知识图谱。

GitHub trending:all (+1102★)#code-intelligence #knowledge-graph[Coding Agents]

AI代理工具包,含编码CLI、统一LLM API等。

GitHub trending:typescript (+974★)#agents #toolkit #cli[Coding Agents][Agent Harness]

Beads:为编程agent提供内存升级。

GitHub trending:all (+498★)#coding-agent #memory #context[Context Engineering][Coding Agents]

Google与Kaggle推出AI Agents Vibe Coding课程。

Google AI Blog#ai-agents #vibe-coding #education[Coding Agents]

微软开源Whisper风格音频模型VibeVoice。

Simon Willison#audio #whisper #open-source[Model Release]

Skymizer 发布新架构,单卡可运行 700B 参数模型

Reddit r/LocalLLaMA#inference #hardware #architecture

Hugging Face ml-intern:开源ML工程师,自动读论文、训练模型。

Co-Starred#open-source #automation #mlops[Agent Harness]

通过 ExecuTorch 在设备上运行 OpenAI 隐私过滤模型

Reddit r/LocalLLaMA#privacy #on-device #executorch

Reddit讨论:生产RAG系统的三个局限性。

Reddit r/MachineLearning#rag #production #limitations[Context Engineering]

TradingAgents:多智能体LLM金融交易框架。

GitHub trending:all (+248★)#multi-agent #finance #trading[Agent Harness]

Applied Intuition将AI应用于采矿、无人机等物理世界。

Latent Space#physical-ai #robotics #autonomous-vehicles

GBNF 语法优化提升 Qwen3.6 模型推理速度

Reddit r/LocalLLaMA#qwen #inference #optimization

Reddit讨论:INT8量化比FP16精度更高。

Reddit r/MachineLearning#quantization #deep-learning

在代码编辑器中提供AI代理开发团队。

GitHub trending:typescript (+58★)#coding-agent #ide #ai[Coding Agents]

提出AI辅助研究的认证框架。

ArXiv cs.AI#ai-research #certification #framework

Google Meet语音翻译功能向移动设备推出。

Simon Willison#speech-translation #google-meet #mobile

Claude的多智能体编排平台,支持自主工作流。

GitHub trending:typescript (+178★)#agents #orchestration #claude[Agent Harness]

Claude Code模板的CLI工具,用于配置和监控。

GitHub trending:all (+154★)#claude-code #cli #templates[Coding Agents]

OpenAI Agents SDK实现的客服用例演示。

GitHub trending:python (+56★)#agents #openai #sdk[Agent Harness]

探讨AI代理如何加速工程研发效率。

themanufacturer.com#agentic-ai #engineering #productivity

文章探讨AI模拟意识与实例化意识的区别。

theverge.com#consciousness #philosophy

端到端微调教程,以 wildfire 检测为例

Reddit r/LocalLLaMA#fine-tuning #tutorial[Post-Training]
[STATS] 67 items · 33 sources · Score >= 5.0
Powered by Tavily + Exa + RSS + DeepSeek