memory-augmented

#memory-augmented

Fractale-350M-base: memory as trained behaviour instead of long context, a fully open research release

Reddit r/LocalLLaMA ↗ · 昨天

Fractale-350M-base 是一个386M参数的基础模型，从零开始预训练，采用新颖的训练快速权重记忆库（8个向量）替代长上下文，完全开源，包括权重、代码和研究日志。

0 人收藏 0 人点赞

#memory-augmented

MAGE：理解多组件提示优化中的稳定性与性能权衡

arXiv cs.CL ↗ · 6天前缓存

本文介绍了MAGE，一个用于分析提示优化中组件交互的框架，揭示了一种提示优化耦合效应（POCE），其中结合多个随机信号可以提高性能但会增加方差。它提供了对稳定性-性能权衡的洞察以及提示优化的实用指导。

0 人收藏 0 人点赞

#memory-augmented

面向机器人操作的视觉-语言-动作模型中的双潜在记忆

Hugging Face Daily Papers ↗ · 2026-07-08 缓存

LaMem-VLA提出了一种原生于潜在记忆的框架，将短期和长期历史经验直接整合到视觉-语言-动作推理中，从而在长周期机器人操作任务上实现更优性能。

0 人收藏 0 人点赞

#memory-augmented

学习用户感知召回：长期对话记忆中的个性化检索

arXiv cs.AI ↗ · 2026-07-02 缓存

本文介绍了Profile-guided Personalized Retrieval Optimization (PPRO)，一种通过将用户画像融入记忆检索并利用强化学习优化检索的框架，增强了长期对话智能体的能力，在现有方法上实现了持续改进。

0 人收藏 0 人点赞

#memory-augmented

ISM：用于连续数学推理的自我改进策略记忆

arXiv cs.LG ↗ · 2026-07-01 缓存

ISM引入了一个自进化记忆系统，该系统存储并优化策略模式，以在连续学习场景下提升冻结LLM的数学推理能力，在MATH-Hard和OlympiadBench基准上优于基线方法。

0 人收藏 0 人点赞

#memory-augmented

面向长周期LLM智能体的选择性记忆保留

arXiv cs.AI ↗ · 2026-06-30 缓存

本文提出TraceRetain，这是一个用于冻结LLM智能体中绑定外部存储的轻量级框架，表明选择性记忆保留主要在记忆流包含噪声时与缓存启发式方法区分开，从而带来任务成功率和效率的提升。

0 人收藏 0 人点赞

#memory-augmented

DuoMem: 面向设备端能力型内存代理的双空间蒸馏框架

Hugging Face Daily Papers ↗ · 2026-06-29 缓存

DuoMem 是一种双空间蒸馏框架，通过上下文空间蒸馏和参数空间蒸馏，将大型语言模型的过程性问题解决能力迁移至紧凑的学生模型，以极少的额外参数实现高性能并提升推理速度。该框架在 ALFWorld 上，将 4B 参数规模模型的任务成功率从 4.3% 提升至 77.9%。

0 人收藏 0 人点赞

#memory-augmented

ReM-MoA：推理记忆维持混合智能体扩展

arXiv cs.AI ↗ · 2026-06-24 缓存

ReM-MoA 引入了一种记忆增强的混合智能体框架，通过排序推理记忆和策划的多样化记忆路由来维持扩展，在五个推理基准测试中优于之前的 MoA 变体。

0 人收藏 0 人点赞

#memory-augmented

EventVLA: 事件驱动的视觉证据记忆用于长时域视觉-语言-动作策略

Hugging Face Daily Papers ↗ · 2026-06-18 缓存

EventVLA 提出了一种稀疏视觉证据记忆框架用于长时域机器人操作，相较于最先进的记忆增强型VLA，平均成功率提升了40%。

0 人收藏 0 人点赞

#memory-augmented

记忆过度：记忆增强模型中的谄媚评估与缓解

arXiv cs.AI ↗ · 2026-06-10 缓存

本文介绍了 MIST，一个用于评估记忆增强大型语言模型中谄媚行为的基准，表明记忆系统将谄媚行为放大了高达 25 倍，并提出了轻量级的缓解措施，在减少谄媚的同时保持事实回忆能力。

0 人收藏 0 人点赞

#memory-augmented

面向长周期LLM代理的Meta-Cognitive Memory Policy Optimization

Hugging Face Daily Papers ↗ · 2026-05-28 缓存

介绍了Belief Entropy和Metacognitive Memory Policy Optimization (MMPO)，以提高长周期LLM代理的记忆质量，优于现有方法，并在长上下文中保持性能。

0 人收藏 0 人点赞

#memory-augmented

在长期用户交互中个性化具身多模态大语言模型智能体

arXiv cs.AI ↗ · 2026-05-27 缓存

本文提出Polar，一种多模态记忆增强框架，用于在长期用户交互中个性化具身MLLM智能体，利用知识图谱和情景记忆从累积上下文中定位用户意图的实例。

0 人收藏 0 人点赞

#memory-augmented

Memory-R2: 面向长程记忆增强型LLM代理的公平信用分配

arXiv cs.LG ↗ · 2026-05-22 缓存

Memory-R2 引入了 LoGo-GRPO，这是一种结合了局部与全局分组相对优化的训练框架，为长程记忆增强型LLM代理提供更公平的信用分配，从而在多种骨干网络上提升准确率和推理延迟。

0 人收藏 0 人点赞

#memory-augmented

面向CAD生成的记忆增强强化学习智能体

arXiv cs.AI ↗ · 2026-05-20

本文提出了一种用于CAD生成智能体的记忆增强强化学习框架，该框架集成了几何内核工具链、双轨记忆和动态效用检索，以处理具有长操作序列和几何约束的复杂CAD模型，从而提升了成功率和几何一致性。

0 人收藏 0 人点赞

#memory-augmented

具有分层信念状态记忆的智能推荐系统

arXiv cs.CL ↗ · 2026-05-15 缓存

本文提出ARS，一种记忆增强的智能推荐系统，将推荐视为部分可观测问题，并采用分层信念状态记忆结构。它在四个基准上取得了最先进的性能，相比基线有显著提升。

0 人收藏 0 人点赞

#memory-augmented

SafeHarbor：面向LLM代理安全的分层记忆增强护栏

Hugging Face Daily Papers ↗ · 2026-05-07 缓存

SafeHarbor是一个用于LLM代理安全的新型框架，它利用分层记忆和自进化机制来平衡安全性与实用性，在良性任务和恶意任务上均实现了最先进的性能。

0 人收藏 0 人点赞

memory-augmented

提交意见反馈