HAGE: 通过强化学习驱动加权图演化利用智能体记忆

Hugging Face Daily Papers 论文

摘要

HAGE引入了一种加权多关系记忆框架,能够在统一关系记忆图上实现查询条件化的遍历,通过自适应记忆检索和基于强化学习的优化来提高长程推理准确性。

在智能体大语言模型(LLM)系统中,记忆检索通常被视为一个静态查找问题,依赖于平面向量搜索或固定的二元关系图。然而,固定的图结构无法捕捉事件之间关系的不同强度、置信度和查询相关相关性。在本文中,我们提出了HAGE,一种加权多关系记忆框架,将检索重新构想为在统一关系记忆图上的序列化、查询条件化遍历。记忆被组织为共享记忆节点上的关系特定图视图,其中每条边都与一个可训练的关系特征向量相关联,该向量编码多个关系信号。给定一个查询,基于LLM的分类器识别关系意图,路由网络动态调制边嵌入的相应维度。遍历分数通过语义相似性与这些查询条件化边表示的学习组合来计算。这使得记忆遍历能够优先考虑高实用性的关系路径,同时柔和地抑制噪声或弱相关连接。除了自适应遍历,HAGE还引入了一个基于强化学习的训练框架,利用下游任务共同优化路由行为和边表示。最后,实证结果表明,与最先进的智能体记忆系统相比,长程推理准确性得到提高,并实现了良好的准确性与效率权衡。我们的代码可在 https://github.com/FredJiang0324/HAGE_MVPReview 获取。
查看原文
查看缓存全文

缓存时间: 2026/05/14 04:16

论文页面 - HAGE: 基于强化学习驱动的加权图演化实现智能体记忆

来源:https://huggingface.co/papers/2605.09942 发表于5月11日

·

由 https://huggingface.co/dj220001 提交

dj (https://huggingface.co/dj220001) 于5月14日

摘要

HAGE 提出了一种加权多关系记忆框架,支持对统一关系记忆图进行查询条件化遍历,通过自适应记忆检索和基于强化学习的优化,提升长程推理准确性。

在智能体大语言模型(LLM)系统中,记忆检索通常被视为静态查找问题,依赖于平面向量搜索或固定的二元关系图。然而,固定的图结构无法捕捉事件之间关系的可变强度、置信度及查询相关的相关性。本文提出 HAGE,一种加权多关系记忆框架,将检索重新概念化为在统一关系记忆图上进行的序列化、查询条件化遍历。记忆被组织为共享记忆节点上的关系特定图视图,每条边关联一个可训练的关系特征向量,编码多种关系信号。给定查询后,基于 LLM 的分类器识别关系意图,路由网络动态调制边嵌入的对应维度。遍历得分通过学习语义相似性与这些查询条件化边表示的组合来计算。这使得记忆遍历能够优先选择高实用性的关系路径,同时柔和地抑制噪声或弱相关连接。除自适应遍历外,HAGE 还进一步引入基于强化学习的训练框架,利用下游任务联合优化路由行为和边表示。最后,实验结果表明,与最先进的智能体记忆系统相比,HAGE 在长程推理准确性上有所提升,并在准确性与效率之间取得了良好的平衡。我们的代码可在 https://github.com/FredJiang0324/HAGE_MVPReview 获取。

查看 arXiv 页面 (https://arxiv.org/abs/2605.09942) 查看 PDF (https://arxiv.org/pdf/2605.09942) 项目页面 (https://github.com/FredJiang0324/HAGE_MVPReview) GitHub6 (https://github.com/FredJiang0324/HAGE_MVPReview) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.09942)

在您的智能体中获取此论文:

hf papers read 2605\.09942

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用本论文的模型0

没有模型链接本论文

请在模型 README.md 中引用 arxiv.org/abs/2605.09942 以从本页链接。

引用本论文的数据集0

没有数据集链接本论文

请在数据集 README.md 中引用 arxiv.org/abs/2605.09942 以从本页链接。

引用本论文的 Spaces0

没有 Space 链接本论文

请在 Space README.md 中引用 arxiv.org/abs/2605.09942 以从本页链接。

包含本论文的收藏集0

没有收藏集包含本论文

将本论文添加到一个收藏集 (https://huggingface.co/new-collection) 中以从本页链接。

相似文章

Helix_AGI 个人项目

Reddit r/AI_Agents

一位开发者分享了 Helix-AGI,这是一个持续运行的认知代理,使用基于物理的记忆检索系统,通过熵引力方程和欧拉-拉格朗日动力学,整合了时间近性、结构重要性和语义邻近性,无需单独调整权重。