Intelligence.Log

Saturday, May 23, 2026

Extracted: 79 items. Sources: 43. Filter: Score >= 5.0

> Headlines & Launches

Anthropic即将完成超300亿美元融资,创AI领域纪录。

bloomberg.com#funding #anthropic #investment[Model Release]

DeepSeek推进102.9亿美元融资,创始人承诺继续开发开源AI。

Reddit r/LocalLLaMA#deepseek #funding #open-source[Model Release]

DeepSeek创始人宣布AGI目标,同时推进100亿美元融资。

bloomberg.com#deepseek #agi #funding[Model Release]

马斯克和扎克伯格联手破坏特朗普AI行政令,影响AI政策。

semafor.com#policy #regulation #us

特朗普科技盟友阻挠AI行政令,白宫计划被披露。

axios.com#ai-policy #executive-order #politics

欧盟与Anthropic谈判因Mythos AI网络安全问题陷入僵局。

bloomberg.com#eu #anthropic #cybersecurity

AI基础设施初创Exa、Modal、TurboPuffer成为新独角兽。

Latent Space#funding #ai-infrastructure #unicorn

美国阻止互联网用户利用AI重现已故飞行员声音。

arstechnica.com#ai-ethics #voice-cloning #regulation

麦肯锡与AppliedAI合作,推动受监管行业的智能体AI。

consultancy-me.com#partnership #agentic-ai #regulated-industry[Agent Harness]

中国审查AI驱动股票波动背后的公司和基金。

bloomberg.com#china #regulation #stock-market

FTC对三家公司的AI监听营销服务处以近百万美元罚款。

Simon Willison#ftc #regulation #ai-marketing

> Research & Innovation

Anthropic发布Project Glasswing初步更新,涉及AI可解释性研究。

HN (301)#anthropic #interpretability #research

提出SOLAR自主智能体,实现终身学习与持续适应。

ArXiv cs.AI#llm #autonomous-agent #continual-learning[Agent Harness]

检索合成可互操作多智能体工作流。

ArXiv cs.AI#multi-agent #workflow #retrieval[Agent Harness]

开放世界评估衡量前沿AI能力。

ArXiv cs.AI#benchmark #frontier-ai #evaluation[Evals]

超越结果排行榜的LLM智能体评估框架。

ArXiv cs.AI#llm-agent #benchmark #evaluation[Evals]

NVIDIA发布Nemotron扩散语言模型,实现近光速文本生成。

Hugging Face#diffusion #text-generation #nvidia[Model Release]

工具增强智能体用于闭环工业设计与仿真优化。

ArXiv cs.AI#tool-use #industrial-design #cad-cae[Tool Use]

RL引导对抗生成用于高阶心智理论评估。

ArXiv cs.AI#theory-of-mind #reinforcement-learning #adversarial[Evals]

基于重写的护栏确保青少年LLM安全。

ArXiv cs.CL#llm-safety #guardrails #adolescent

多轮LLM评判合成基准生成器。

ArXiv cs.CL#llm-as-judge #benchmark #multi-turn[Evals]

Nature发表纵向健康AI智能体框架,用于持续健康管理。

nature.com#health-ai #agent #framework[Agent Harness]

Antigravity 2.0在OpenSCAD 3D LLM基准测试中登顶。

HN (346)#llm #benchmark #3d-modeling[Evals]

神经网络学习逻辑推理排序,提升推理效率。

ArXiv cs.AI#logical-reasoning #embeddings #neural-symbolic

提出不确定性增强系统的评估指标族。

ArXiv cs.AI#uncertainty #evaluation #metrics[Evals]

语义级检测AI生成的同行评审。

ArXiv cs.CL#ai-detection #peer-review #semantic

大语言模型的概率归因方法。

ArXiv cs.CL#attribution #llm #probabilistic

提出PromptNCE方法,用LLM和对比估计提示预测互信息。

ArXiv cs.CL#llm #mutual-information #prompting

通过语言模型函数调用实现反思性提示调优。

ArXiv cs.CL#llm #prompt-tuning #function-calling[Tool Use]

研究揭示多智能体LLM系统中域伪装注入攻击可逃避检测。

HN (33)#multi-agent #security #llm[Agent Harness]

ViMax:一体化智能体视频生成框架,含导演、编剧等角色。

GitHub trending:python (+266★)#video-generation #agent #multimodal[Agent Harness]

AI智能体人格工程用于谈判研究。

ArXiv cs.AI#personality #negotiation #agent

GPU加速麻将模拟器用于强化学习。

ArXiv cs.AI#reinforcement-learning #game #simulator

提出残差技能优化方法提升Text-to-SQL集成效果。

ArXiv cs.CL#text-to-sql #ensemble #llm

构建罕见病例检索基准,评估临床问答系统。

ArXiv cs.CL#retrieval #clinical-qa #benchmark[Evals]

测量LLM在数值动作中模糊强度词的语义保留。

ArXiv cs.CL#llm #semantics #evaluation

OpenBMB发布1.58位模型BitCPM-CANN,适配华为Ascend 910B。

Reddit r/LocalLLaMA#quantization #openbmb #huawei

生成式AI扩展交通安全数据访问。

ArXiv cs.CL#generative-ai #transportation #nlp

实时检测电话中人类语音的工具。

Reddit r/MachineLearning#audio #detection

AI伴侣的稳态认知架构预印本。

Reddit r/MachineLearning#cognitive-architecture #ai-companion

> Engineering & Resources

预索引代码知识图谱,减少AI编码agent的token和工具调用。

GitHub trending:all (+3684★)#knowledge-graph #ai-coding #code-index[Coding Agents]

Anthropic官方Claude Code插件目录发布。

GitHub trending:all (+2549★)#claude #plugins #ai-coding[Coding Agents]

NousResearch发布Hermes Agent,一个可成长的AI代理框架。

GitHub trending:python (+1743★)#agent-framework #open-source[Agent Harness]

Google I/O展示AI驱动科学路径的转变,强调AI在科研中的应用。

technologyreview.com#ai-science #google #research

BeeLlama v0.2.0发布,单卡RTX 3090推理速度提升4倍以上。

Reddit r/LocalLLaMA#inference #optimization #llama-cpp

NuExtract3发布:4B开源VLM,支持Markdown/OCR/结构化提取。

Reddit r/MachineLearning#vlm #ocr #open-source

终端AI编码agent,支持哈希锚定编辑、LSP、Python等。

GitHub trending:all (+457★)#ai-coding #terminal #agent[Coding Agents]

将代码转为交互式知识图谱,支持探索和问答。

GitHub trending:all (+1393★)#knowledge-graph #code-analysis #interactive

DeepSeek将V4 Pro模型API价格永久降至原价的1/4。

HN (306)#deepseek #pricing #api[Model Release]

Chrome DevTools MCP,为编码agent提供浏览器调试能力。

GitHub trending:all (+501★)#mcp #devtools #ai-coding[Coding Agents][Tool Use]

DeepSeek 4 Flash本地推理引擎,支持Metal。

Co-Starred#deepseek #local-inference #metal[Model Release]

dotnet/skills仓库,帮助AI编码agent使用.NET和C#。

GitHub trending:all (+389★)#dotnet #ai-coding #skills[Coding Agents]

内存短缺导致消费电子产品重新定价,AI需求是主因。

Simon Willison#memory-shortage #consumer-electronics #ai-impact

前DeepMind研究员警告:仅靠基准测试无法确保AI安全。

gizmodo.com#benchmark #ai-safety #opinion[Evals]

体验Google AI眼镜,评价接近成熟但仍有不足。

techcrunch.com#wearable #google #ai-glasses

微调Cohere Transcribe以支持说话人分离和时间戳。

Reddit r/LocalLLaMA#speech-recognition #fine-tuning #open-source

llama.cpp新增对NVIDIA Blackwell PDL的支持,提升性能。

Reddit r/LocalLLaMA#llama-cpp #nvidia #inference

Meta发布SAM 3,最新分割一切模型,支持推理和微调。

GitHub trending:python (+63★)#segmentation #vision #meta[Model Release]

开源代理时代IDE Superset发布。

HN (79)#ide #agents #open-source[Coding Agents]

微软AI代理治理工具包,含策略执行、沙箱等。

GitHub trending:python (+86★)#governance #security #agent[Agent Harness]

MemOS:LLM和AI代理的自我进化记忆系统,节省35% token。

GitHub trending:typescript (+59★)#memory #llm #token-efficiency[Context Engineering]

观点:专业化优于规模,AI采购决策常忽略此变量。

Hugging Face#ai-procurement #specialization #opinion

Qwen3.6-35B-A3B在8GB显卡上实现262K上下文和30+ tps。

Reddit r/LocalLLaMA#qwen #quantization #long-context[Context Engineering]

ByteShape推出Qwen3.6-35B-A3B量化,比Unsloth IQ快30%。

Reddit r/LocalLLaMA#quantization #qwen #inference

llama.cpp实验性分支实现专家优先调度,针对12GB显存。

Reddit r/LocalLLaMA#llama-cpp #mixture-of-experts #optimization

LQS v3.1:开放AI训练数据评级方法论。

Reddit r/MachineLearning#data-quality #methodology

HeyGen Hyperframes:用HTML写视频,专为代理构建。

GitHub trending:typescript (+294★)#video-generation #html #agent

GitNexus:浏览器内代码知识图谱引擎,零服务器。

GitHub trending:typescript (+239★)#knowledge-graph #code-analysis

Honcho:用于构建有状态AI代理的记忆库。

GitHub trending:python (+133★)#memory #agent #library[Context Engineering]

Google Stitch Skills库,与MCP服务器配合的代理技能。

GitHub trending:typescript (+41★)#mcp #agent-skills #google[Agent Harness]

即使讨厌AI,用户仍将使用Google AI搜索,分析其不可避免性。

wired.com#google-search #ai-adoption #opinion

Qwen3.6 27B量化版在16GB显存上达到40 tok/s。

Reddit r/LocalLLaMA#qwen #quantization #inference

发布Gemma-4-26B-A4B的无审查微调版本,拒绝率低。

Reddit r/LocalLLaMA#fine-tuning #uncensored #gemma

Oh My OpenAgent:最佳代理框架,前身为oh-my-opencode。

GitHub trending:typescript (+159★)#agent-framework #open-source[Agent Harness]

AutoResearchClaw:全自动科研代理,从想法到论文。

GitHub trending:python (+73★)#research-agent #automation[Agent Harness]

开源看板桌面应用,每张卡片可运行并行AI代理。

HN (163)#kanban #agents #open-source[Agent Harness]

AWS AI-DLC工作流:AI编码代理的自适应工作流规则。

GitHub trending:python (+25★)#coding-agent #workflow #aws[Coding Agents]

Google I/O 2026 Dialogues阶段回顾,展示AI进展。

Google AI Blog#google #io-2026 #ai-showcase

为16GB NVIDIA显卡推出Qwen-27B的IQ4_KS量化版本。

Reddit r/LocalLLaMA#quantization #qwen #llama-cpp
[STATS] 79 items · 43 sources · Score >= 5.0
Powered by Tavily + Exa + RSS + DeepSeek