Monday, May 18, 2026
今日AI领域动态:Anthropic和OpenAI占据AI初创公司收入89%的份额,市场主导地位进一步巩固重大发布。研究方面,有论文对比了5种abliteration方法研究论文,并综述了LLM架构中KV共享等最新进展研究论文。工具更新上,Hugging Face发布开源ML工程师项目工具更新,另有OpenHuman个人AI超级智能项目工具更新。观点洞察指出,AI是技术而非产品观点洞察,且其应用瓶颈在于模糊需求而非速度观点洞察。
> Headlines & Launches
> Research & Innovation
85 GPU小时对比5种abliteration方法,含基准测试。
综述LLM架构最新进展:KV共享、mHC和压缩注意力。
在混合Blackwell/Ada集群上对比vLLM、SGLang和llama.cpp的长上下文推理性能。
使用Gemini Flash在LongMemEval上取得第一,非Pro版本。
在RTX 5090上测试llama.cpp MTP对Qwen3.6的支持。
智能体视频生成框架,集导演、编剧、制片于一体。
> Engineering & Resources
OpenHuman:个人AI超级智能,私密且强大。
预索引代码知识图谱,减少Claude Code等工具调用。
Hugging Face发布开源ML工程师项目,可读论文、训练模型。
antirez发布DeepSeek 4 Flash本地推理引擎,支持Metal。
认为AI不会让流程更快,瓶颈在于模糊需求。
开源代码搜索工具Semble,专为AI代理设计,比grep少用98%的token。
Anthropic官方发布的Agent Skills公共仓库。
面向科研、工程、金融等领域的AI代理技能集。
开源AI视频平台替代品,支持200+模型。
llama.cpp PR优化MTP提示解码速度。
CLI-Anything:让所有软件成为Agent原生。
研究强调AI医疗应以患者结果而非基准衡量。
用户分享使用Qwen3.6:35b-a3b模型进行日常软件开发的经验。
多源内容处理器,将微信文章等转为播客/PPT。
亚利桑那大学学生嘘Eric Schmidt的AI鼓吹。
结构化工作流与小型本地模型结合的有效性实验。
ROCm 7.13 nightly为Strix Halo添加优化。
揭露一个误导高中生付费进行学术不端行为的项目。
SkillKit让AI编程智能体跨平台共享技能。
比较Apple Silicon与OpenRouter运行离线LLM的能耗成本。
苹果Siri改版可能包含自动删除聊天功能。
2026年毕业典礼演讲建议避免提及AI。
Gemma-4-Gembrain-31B合并模型发布,增强逻辑与创意。
用户抱怨AI研究社区充斥低质量内容,感到疏离。
ML负责人与PM就评估方法论的层独立性展开争论。
根据硬件推荐最佳本地LLM,基于真实基准。
自主AI渗透测试工具,分析源码并执行攻击。
AI技能军备竞赛正在进入汽车行业。
对比M5、DGX Spark等硬件在本地LLM上的性能。
双GPU llama.cpp加速技巧与split-mode tensor问题。
用户询问在7900xtx上使用MTP推测解码的体验。
讨论当公共数据集不匹配用例时如何处理训练数据。