标签
一位产品经理分享了在真实 Q3 战略简报上对 Minimax M3 的 1M 上下文窗口的实操测试,指出在约 20 万 token 以内来源归因很准确,但超过后综合能力下降。
介绍Parallel-Synthesis框架,该框架能够直接消费来自并行工作代理的KV缓存,将首令牌时间减少2.5倍至11倍,同时在代理任务上保持或提升性能。
本文介绍了一种名为ISE的三阶段合成范式,用于生成带有基于执行的多轮操作系统代理轨迹,并证明在生成的ISE-Trace数据集上进行微调能显著提升代理在ClawEval上的性能。
Garry Tan 推出了 GBrain,这是一个开源的 AI 智能体记忆层,为编码智能体提供综合、图遍历和差距分析功能,相比传统检索方法有显著改进。
一份全面的入门指南,综合了150多项关于后训练推理数据的公开研究,围绕四个关键问题组织该领域:数据对象、有用性、构建和扩展。
GBrain 是一款工具,能够增强 AI 智能体的合成分析、差距分析、自连线类型化知识图谱、混合搜索以及夜间梦境周期等功能,并且这一切都建立在 Obsidian 中现有的 .md 文件之上。
提出FM-fMRI,一种事件条件流匹配模型,能够从静息态fMRI合成任务fMRI时间序列,在Human Connectome Project和内部自闭症队列上实现了优于基线的频谱和连接一致性,并改进了下游自闭症分类性能。
一位开发者将其AI智能体的LLM调用拆分为廉价的路由模型(GPT-OSS 120B)用于工具选择,以及高级模型(gpt-5.4)用于合成,成本降低了约78%,同时保持了输出质量。
这篇文章探讨了 Andrej Karpathy 提出的“LLM Wiki”概念,认为这是传统 RAG 的范式转变,主张通过维护一个持久且不断演化的知识基底,可以实现知识的复合式理解,而非无状态的检索。
MASS-RAG 提出了一种多智能体合成框架,用于检索增强生成,通过专门智能体在 RAG 流程中各司其职。