@_avichawla:为你的Agent构建类人记忆(开源)!每个智能体和RAG系统在实时知识方面都面临挑战……

X AI KOLs Following 工具

摘要

Graphiti是一个开源工具,通过持续演进且具有时间感知的知识图谱,为AI代理构建类人记忆,相比MemGPT,准确率最高提升18.5%,延迟降低90%。

为你的Agent构建类人记忆(开源)! 每个智能体和RAG系统在实时知识更新和快速数据检索方面都面临挑战。 Graphiti通过其持续演进且具有时间感知的知识图谱解决了这些问题。 像人类一样,Graphiti将Agent的记忆组织成片段,从这些片段中提取实体及其关系,并将它们存储在知识图谱中: (阅读时请参考下图) 1) 片段子图:捕获带有时间戳的原始数据,保留每个细节以便于历史查询。 2) 语义实体子图:提取实体(例如“Alice”、“Google”)和事实(“Alice在Google工作”)。所有内容都有版本,因此过时信息会被替换。 3) 社区子图:将相关实体分组为集群,并提供摘要以加快检索速度。 与MemGPT等工具相比,Graphiti的准确率最高提升18.5%,延迟降低90%。 它完全开源,拥有26k+星标。 我已将仓库链接分享在回复中。
查看原文
查看缓存全文

缓存时间: 2026/05/24 08:18

为您的智能体构建类人记忆(开源)!

每个智能体和RAG系统都在实时知识更新和快速数据检索方面挣扎。

Graphiti通过其持续演进且具备时间感知的知识图谱解决了这些问题。

像人类一样,Graphiti将智能体的记忆组织成片段,从这些片段中提取实体及其关系,并存储在知识图谱中:

(请参考下图阅读)

  • 片段子图:捕获带有时间戳的原始数据,保留每个细节以便于历史查找。
  • 语义实体子图:提取实体(例如“Alice”、“Google”)和事实(“Alice在Google工作”)。所有内容都有版本控制,因此过时信息会被替换。
  • 社区子图:将相关实体分组为聚类,并提供摘要以加快检索。

与MemGPT等工具相比,Graphiti的准确率最高提升18.5%,延迟降低90%。

它完全开源,拥有26,000+星标。

我已在回复中分享了仓库。

GitHub仓库:https://github.com/getzep/graphiti

(别忘了给它点星 )

Karpathy关于强化学习的预测正在成为现实!

他认为奖励函数不可靠,并主张单一的奖励数值维度太低,无法教会智能体在复杂任务中何为“好”。为了解决这个问题,智能体需要知识引导的审查作为更高维度的反馈通道。

如今,每个主要AI实验室都在使用强化学习训练模型(OpenAI、Anthropic、DeepSeek)。

而它们的关键瓶颈始终是奖励函数。

DeepSeek的GRPO在数学和代码方面表现良好,因为环境给出了二元信号。

但对于真实智能体任务,仍然需要有人手动编写评分函数。这需要数天时间,而且每次流程变化都会失效。

RULER(在OpenPipe ART中实现,10k星标)解决了Karpathy指出的确切问题。

奖励标准用自然语言定义,LLM根据该描述评估每个轨迹,为训练提供反馈。

我使用GRPO和这个精确的工作流程训练了一个玩2048游戏的Qwen3 1.4B智能体。

在这个案例中,智能体看到棋盘,选择一个方向,RULER根据自然语言定义评估结果。

你可以在GitHub上查看完整实现并亲自尝试。

这是ART仓库:http://github.com/OpenPipe/ART

(别忘了给它点星 )

就像RLHF取代了人工排名、GRPO取代了评论家模型一样,自然语言奖励正在取代手动编码的评分函数。

强化学习奖励工程现在变成了提示工程。

我在下面的文章中写了一篇完整指南,涵盖了从RLHF到GRPO再到RULER的LLM智能体强化学习。

相似文章

rohitg00/agentmemory

GitHub Trending (daily)

agentmemory 是一个开源的持久化记忆层,专为 AI 编程智能体(Claude Code、Cursor、Gemini CLI、Codex CLI 等)设计。它通过知识图谱、置信度评分和混合搜索技术,借助 MCP、Hooks 或 REST API,为智能体提供跨会话的长期记忆能力。该项目基于 iii 引擎构建,无需外部数据库,提供 51 个 MCP 工具。