@hwchase17: https://x.com/hwchase17/status/2071963622298050997
摘要
文章讨论了AI代理中新兴的'wiki记忆'模式,其中原始源数据被智能压缩成一个持久、结构化的知识层,代理可以高效地使用它。文章将其与基础RAG进行了比较,并给出了DeepWiki和LLM Wiki等例子。
查看缓存全文
缓存时间: 2026/06/30 15:43
Wiki 记忆
智能体的记忆仍处于早期阶段,几乎没有统一标准。“记忆”对每个人意味着不同的东西。但一种常见模式正在浮现:Wiki 记忆。
思路很简单:用一个智能体将原始源数据转化为紧凑、持久、可供智能体读取的知识层。
为什么用 Wiki?
原始数据包含大量知识,但直接暴露给智能体往往效率低下。日志、笔记、代码、文档、实验、Slack 线程和转录内容过于嘈杂且体积庞大。因此,我们改为对这些数据运行一个处理流程,将其转化为更密集的表示。
这与基础的 RAG 不同。RAG 通常在查询时检索原始片段。而 Wiki 会预先计算并维护一个更高层次的综合,这样智能体就不必每次都重新发现结构。
这种需求几乎无处不在。当与一家研究公司的朋友交谈时,他谈到了研究人员头脑中的所有知识。他想“克隆他们的大脑”,这样即使他们离开,知识仍然留在公司。他希望通过查看他们运行的实验、写的笔记和采取的行动,能够近似实现这种“大脑克隆”。
Wiki 就是实现这一目标的一种实用方式:不是存储一切,而是将重要内容压缩成一个可重复使用的知识库。
什么是“Wiki”?
Wiki 是一种由智能体维护的数据结构,以对智能体友好的方式表示源知识。
在实践中,这通常意味着对一个源材料运行一个智能体,并要求它创建一组文件,供未来的智能体用于更快地理解该领域。
关键不在于它字面上看起来像维基百科。关键在于它持久、结构化、可检查,并随时间不断更新。
Wiki 的例子
Cognition 的 DeepWiki 可能是我记忆中看到的第一个例子。DeepWiki 为 GitHub 仓库生成 AI 生成的文档。它旨在为人类和编码智能体提供代码库更高级别的思维导图,使其更容易理解和导航。
Karpathy 最近写了一篇关于他所谓的“LLM Wiki”或“LLM 知识库”的文章。这是同一模式更通用的形式:不仅限于代码,还可以处理任意源文件。他的框架是,LLM 增量式构建并维护一个持久的 Markdown 格式的 Wiki,位于用户和原始源之间。
Factory 推出了 AutoWiki,作为类似 DeepWiki 的产品。AutoWiki 分析代码库并生成结构化、可浏览的文档,随着仓库的变化保持最新状态。
这种模式也与 LangMem、Letta、Mem0 和 Zep 等记忆系统相邻。这些系统解决更广泛的智能体记忆问题,而 Wiki 记忆之所以引人注目,是因为它通常使用最简单的底层:文件。
每个领域都有一个 Wiki
我认为,对于每个领域,都会有一个值得你创建的知识库。这个知识库不是仅仅是原始数据。它是原始数据的智能压缩版本。
这里有许多开放问题:
- 原始数据是什么?
- 压缩数据的最佳格式是什么?
- 数据应该如何压缩?
- 压缩表示应该如何保持更新?
我们开始看到一些常见答案出现:
- 原始数据是什么?→ 任何智能体可以读取或访问的内容
- 压缩数据的最佳格式是什么?→ 文件
- 如何压缩数据?→ 一个智能体
- 如何维护它?→ 一个智能体
文件之所以有吸引力,是因为它们可检查、可编辑、可版本控制,并且易于智能体读写。
Wiki 并非记忆的全部。它们最适合持久领域知识,而不一定是短期对话状态、用户偏好或高频事件日志。但对于许多领域,Wiki 记忆可能是我们拥有的最简单实用的长期记忆模式。
相似文章
@appliedcompute: https://x.com/appliedcompute/status/2052826576723841292
Applied Compute 推出 ACL-Wiki,这是一个基于其 Context Engine 构建的持续学习记忆系统,能够记录来自 Cursor、Claude Code 和 Codex 的编程智能体交互,从而构建一个不断优化的 Contextbase,在两周内将关键记忆率提升约一倍。该系统通过 MCP 服务器暴露的 Remember-Refine-Retrieve 流水线,为编程智能体提供随使用而持续改进的机构记忆。
寻求反馈:一个AI智能体和人类都能使用的记忆系统
作者介绍了Noosphere,一个面向AI智能体和人类的开源记忆与维基层,正在寻求对其基于Postgres的结构化记忆、Redis缓存的召回机制以及可人工编辑的维基页面的反馈。
@Voxyz_ai: https://x.com/Voxyz_ai/status/2056043700757705122
解释了AI代理的两种记忆模式:GBrain(可查询的公司维基)和Lossless(完整对话记录),帮助代理在会话之间和会话内部保留和检索事实。
@NainsiDwiv50980:RAG 可能已经过时。一个月前,Andrej Karpathy 发布了一个名为 “LLM Wiki” 的简单 GitHub gist。不……
Andrej Karpathy 的 “LLM Wiki” 概念正在激发一个专注于持久 AI 记忆和自维护知识库的快速开发者生态系统,这可能使传统 RAG 过时。
@unicodef1wn: 前谷歌工程师用12分钟解释AI智能体记忆,比500美元的课程更好。用户提示 → 工作记忆 → 大语言模型…
一位前谷歌工程师在12分钟内解释了AI智能体记忆架构,涵盖工作记忆和三个记忆层(程序性、语义、情景),并使用总结器防止令牌膨胀,类似于Claude所用的。