Sunday, May 10, 2026
今日AI领域动态密集:Nvidia今年已承诺400亿美元AI股权交易[#item-techcrunch-com-2026-05-09-nvidia-has-already-committed-40b-t],字节跳动计划将AI基础设施支出提高25%[#item-bloomberg-com-news-articles-2026-05-09-bytedance-targets-25-],而DeepSeek则拒绝阿里巴巴投资以保持独立[#item-reddit-com-r-LocalLLaMA-comments-1t81u76-deepseek-rejects-al]。研究方面,DeepSeek V4完整论文发布详述FP4 QAT细节[#item-reddit-com-r-MachineLearning-comments-1t7yrvr-deepseek-v4-pa],NVIDIA推出含30B/23B/12B推理模型的Star Elastic检查点[#item-reddit-com-r-LocalLLaMA-comments-1t8s83r-nvidia-ai-releases-],另有语言模型实现进化尺度蛋白质结构预测[#item-science-org-doi-10-1126-science-ade2574]。工具更新亮点包括字节跳动开源多模态AI代理栈UI-TARS-desktop[#item-github-com-bytedance-UI-TARS-desktop]及自进化智能体GenericAgent[#item-github-com-lsdefine-GenericAgent]。观点方面,用户分享ChatGPT 5.5 Pro体验[#item-gowers-wordpress-com-2026-05-08-a-recent-experience-with-cha],并指出Claude Code生成HTML效果出奇好[#item-twitter-com-trq212-status-2052809885763747935]。
> Headlines & Launches
Nvidia今年已承诺400亿美元AI股权交易。
字节跳动计划将AI基础设施支出提高25%。
DeepSeek拒绝阿里巴巴投资,优先保持独立。
> Research & Innovation
语言模型实现进化尺度原子级蛋白质结构预测
DeepSeek V4完整论文发布,详述FP4 QAT细节和稳定性技巧。
NVIDIA发布Star Elastic,一个检查点包含30B/23B/12B推理模型,支持零样本切片。
LLM在委托任务时会污染文档
发布ZAYA1-8B推理MoE模型,700M活跃参数,8B总参数。
眼科AI从大模型转向更智能的临床推理
提出Partial Evidence Bench,评估agent系统在受限检索下的表现。
提出贝叶斯agent循环BALAR,用于主动推理和多步任务。
PRISM框架将感知与推理交错,用于多模态顺序决策。
提出Constant-Context技能学习方法,让LLM agent从历史中学习。
智能体视频生成框架,集导演、编剧、制片于一体。
论证LLM谄媚是社会对齐与认知完整性之间的边界失败。
Agentic RAG用于金融文档问答,支持多步数值推理。
OncoAgent:双层多agent框架,用于隐私保护肿瘤临床决策。
LLM排名非阶梯式:实验证明传递性基准图结果。
用可解释性方法理解AI安全策略,指导数据标注和模型行为。
LaTA:符合FERPA的本地LLM自动评分器,用于STEM课程。
> Engineering & Resources
生产级AI编码代理技能集合,提升代理工程能力。
用户分享ChatGPT 5.5 Pro使用体验
字节跳动开源多模态AI代理栈UI-TARS-desktop。
使用Claude Code生成HTML效果出奇好
自进化智能体,从种子代码生长技能树,节省6倍token。
BeeLlama.cpp 新分支,支持推理和视觉,在3090上2-3倍加速。
Hugging Face发布ml-intern:开源ML工程师,读论文、训练模型。
从零开始构建智能体的中文教程,面向AI代理学习。
免费AI编码路由工具,连接多种模型和提供商。
全自动智能体原生交易系统。
本地深度研究工具,SimpleQA达95%,支持多种LLM和搜索引擎。
为AI编码代理提供持久记忆的开源库agentmemory。
AI智能体工具包,含编码CLI、统一LLM API等。
马斯克与奥特曼法庭对决第二周回顾
用户分享在12GB VRAM上以80 tok/s运行Qwen3.6 35B A3B并支持128K上下文。
antirez/ds4:DeepSeek 4 Flash本地推理引擎,支持Metal。
Anthropic发布金融领域AI工具集,用于编码代理。
智能体协作平台,构建和协作智能体队友。
欧洲央行官员称AI风险促使金融基础设施审查
用户分享在Strix Halo上以100k上下文运行Minimax 2.7的配置。
2小时从零训练64M参数小模型的开源项目。
Chrome DevTools MCP,为编码代理提供调试能力。
用户分享在双Mi50上使用Qwen3.6-27B MTP获得1.5倍加速。
跨平台个人AI助手,具备记忆和个性。
报道Meta的AI战略导致员工不满,反映内部文化问题。
开源AI同事Rowboat,具备记忆功能。
前端智能体与生成式UI框架,支持React和Angular。