@_avichawla:为你的Agent构建类人记忆(开源)!每个智能体和RAG系统在实时知识方面都面临挑战……
摘要
Graphiti是一个开源工具,通过持续演进且具有时间感知的知识图谱,为AI代理构建类人记忆,相比MemGPT,准确率最高提升18.5%,延迟降低90%。
查看缓存全文
缓存时间: 2026/05/24 08:18
为您的智能体构建类人记忆(开源)!
每个智能体和RAG系统都在实时知识更新和快速数据检索方面挣扎。
Graphiti通过其持续演进且具备时间感知的知识图谱解决了这些问题。
像人类一样,Graphiti将智能体的记忆组织成片段,从这些片段中提取实体及其关系,并存储在知识图谱中:
(请参考下图阅读)
- 片段子图:捕获带有时间戳的原始数据,保留每个细节以便于历史查找。
- 语义实体子图:提取实体(例如“Alice”、“Google”)和事实(“Alice在Google工作”)。所有内容都有版本控制,因此过时信息会被替换。
- 社区子图:将相关实体分组为聚类,并提供摘要以加快检索。
与MemGPT等工具相比,Graphiti的准确率最高提升18.5%,延迟降低90%。
它完全开源,拥有26,000+星标。
我已在回复中分享了仓库。
GitHub仓库:https://github.com/getzep/graphiti
(别忘了给它点星 )
Karpathy关于强化学习的预测正在成为现实!
他认为奖励函数不可靠,并主张单一的奖励数值维度太低,无法教会智能体在复杂任务中何为“好”。为了解决这个问题,智能体需要知识引导的审查作为更高维度的反馈通道。
如今,每个主要AI实验室都在使用强化学习训练模型(OpenAI、Anthropic、DeepSeek)。
而它们的关键瓶颈始终是奖励函数。
DeepSeek的GRPO在数学和代码方面表现良好,因为环境给出了二元信号。
但对于真实智能体任务,仍然需要有人手动编写评分函数。这需要数天时间,而且每次流程变化都会失效。
RULER(在OpenPipe ART中实现,10k星标)解决了Karpathy指出的确切问题。
奖励标准用自然语言定义,LLM根据该描述评估每个轨迹,为训练提供反馈。
我使用GRPO和这个精确的工作流程训练了一个玩2048游戏的Qwen3 1.4B智能体。
在这个案例中,智能体看到棋盘,选择一个方向,RULER根据自然语言定义评估结果。
你可以在GitHub上查看完整实现并亲自尝试。
这是ART仓库:http://github.com/OpenPipe/ART
(别忘了给它点星 )
就像RLHF取代了人工排名、GRPO取代了评论家模型一样,自然语言奖励正在取代手动编码的评分函数。
强化学习奖励工程现在变成了提示工程。
我在下面的文章中写了一篇完整指南,涵盖了从RLHF到GRPO再到RULER的LLM智能体强化学习。
相似文章
rohitg00/agentmemory
agentmemory 是一个开源的持久化记忆层,专为 AI 编程智能体(Claude Code、Cursor、Gemini CLI、Codex CLI 等)设计。它通过知识图谱、置信度评分和混合搜索技术,借助 MCP、Hooks 或 REST API,为智能体提供跨会话的长期记忆能力。该项目基于 iii 引擎构建,无需外部数据库,提供 51 个 MCP 工具。
@akshay_pachaar: 你的智能体记性很好,但理解力为零。大多数智能体记忆系统都在优化回忆能力。但更难的问题是……
一则关于智能体记忆中模式(Schema)约束重要性的讨论,介绍了 Zep AI 的开源 Graphiti 库,该库用于构建受约束实体和关系类型的时序知识图谱。
构建 Agentic GraphRAG 系统:从知识图谱和本体论到作为 AI 智能体 MCP 服务器的统一记忆
作者认为 GraphRAG 本质上是一个数据建模问题,而非单纯的检索算法,并提出了一种包含五个组件的架构,利用本体论、知识图谱和 MCP 服务器为智能体提供统一记忆。
@Av1dlive:OpenAI 工程师关于 Agent 记忆的 26 分钟演讲,能让你在真正掌握构建 Agent 记忆的方法方面,收获远超独自摸索数月所得……
OpenAI 工程师带来一场 26 分钟的分享,探讨如何为 AI Agent 搭建高效的记忆系统,为 Agent 架构开发者提供极具价值的实战洞察。
Mem0:利用可扩展的长期记忆构建生产就绪的 AI 智能体
Mem0 引入了一种基于图表示的可扩展内存中心架构,旨在提升大语言模型(LLM)在长期对话中的连贯性,在显著降低延迟和 Token 成本的同时,性能优于现有的记忆系统。