PersonalAI 2.0: 通过规划机制增强知识图谱遍历与检索,面向个性化LLM智能体
摘要
PersonalAI 2.0 引入了一个框架,通过集成外部知识图谱与动态多阶段查询处理及自适应规划机制,增强了基于LLM的系统,在多个基准测试中实现了幻觉率降低和精度提升。
查看缓存全文
缓存时间: 2026/05/14 12:18
论文页面 - PersonalAI 2.0:利用规划机制增强知识图谱遍历/检索,用于个性化LLM智能体
来源:https://huggingface.co/papers/2605.13481 作者: , , , , , , , , ,
摘要
PersonalAI 2.0 通过外部知识图谱集成与动态多阶段查询处理及自适应信息搜索机制,增强了基于LLM的系统。
我们提出了 PersonalAI 2.0(PAI-2),这是一个新颖的框架,旨在通过集成外部知识图谱(KG)来增强基于大型语言模型(LLM)的系统。该方法通过引入动态、多阶段的查询处理流水线,解决了现有图检索增强生成(GraphRAG)方法的关键局限性。PAI-2 设计的核心在于其执行自适应、迭代信息搜索的能力,该搜索由提取的实体、匹配的图顶点以及生成的线索查询引导。在六个基准测试(Natural Questions、TriviaQA、HotpotQA、2WikiMultihopQA、MuSiQue 和 DiaASQ)上进行的评估表明,与同类方法(LightRAG、RAPTOR 和 HippoRAG 2)相比,生成答案的事实正确性有所提升。在四个基准测试上,通过 LLM-as-a-Judge 评估,PAI-2 平均提升了 4%,这反映了它在降低幻觉率和提高精度方面的有效性。我们展示了使用图遍历算法(例如 BeamSearch、WaterCircles)相比标准扁平检索器平均提升了 6%,而在六个数据集上,启用搜索计划增强机制相比禁用时通过 LLM-as-a-Judge 评估获得了 18% 的提升。此外,消融研究表明,PAI-2 在 MINE-1 基准上达到了 SOTA 结果,使用 7-14B 层级的 LLM 获得了 89% 的信息保留分数。总体而言,这些发现强调了 PAI-2 作为下一代个性化 AI 应用基础模型的潜力,这类应用需要可扩展、上下文感知的知识表示与推理能力。
查看 arXiv 页面(https://arxiv.org/abs/2605.13481)查看 PDF(https://arxiv.org/pdf/2605.13481)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.13481)
在你的智能体中获取这篇论文:
hf papers read 2605\.13481
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用该论文的模型(0)
没有模型链接这篇论文
在模型 README.md 中引用 arxiv.org/abs/2605.13481,即可从此页链接到该模型。
引用该论文的数据集(0)
没有数据集链接这篇论文
在数据集 README.md 中引用 arxiv.org/abs/2605.13481,即可从此页链接到该数据集。
引用该论文的 Spaces(0)
没有 Space 链接这篇论文
在 Space README.md 中引用 arxiv.org/abs/2605.13481,即可从此页链接到该 Space。
包含该论文的收藏(0)
没有包含该论文的收藏
将这篇论文添加到一个收藏(https://huggingface.co/new-collection)中,即可从此页链接到该收藏。
相似文章
超越LLM:为何可扩展的企业AI落地依赖于Agent逻辑
IBM Research探索了Agent逻辑——诸如知识图谱和程序分析等软件原语——如何引导基于LLM的Agent高效处理复杂的企业工作流,减少幻觉和成本,同时改善结果。
增强元认知AI:基于图论的大语言模型富集的知识图谱填充
MetaKGEnrich是一个全自动流水线,使用图指标检测大语言模型应用中的知识缺口,检索网络证据,并在三个基准数据集上将答案质量提升80%-87%。
MCP-Persona:通过环境模拟对LLM智能体在实际个人应用中的基准测试
MCP-Persona是一种基准测试,用于评估LLM智能体在与个人账户和本地数据库交互的个性化工具上的表现。实验表明,最先进的智能体在个性化工具使用方面面临显著挑战。
基于智能体AI、嵌套学习与语义缓存的幻觉缓解及AI可持续性
本文提出了一种记忆增强的多智能体架构,采用嵌套学习、连续记忆系统和语义缓存来缓解LLM流程中的幻觉问题,在显著减少事实错误的同时提高了运营效率。
学习适应:基于认知感知探索的自我改进网络智能体
提出了SCALE框架,用于自我改进的网络智能体,采用认知感知探索,包含三个对抗角色和图探索策略。同时介绍了从真实网站收集的大规模数据集SCALE-20k,显著提升了基于MLLM的网络智能体的性能。