@hwchase17: https://x.com/hwchase17/status/2071963622298050997

X AI KOLs Timeline 新闻

摘要

文章讨论了AI代理中新兴的'wiki记忆'模式,其中原始源数据被智能压缩成一个持久、结构化的知识层,代理可以高效地使用它。文章将其与基础RAG进行了比较,并给出了DeepWiki和LLM Wiki等例子。

https://t.co/SsJz6y2pBy
查看原文
查看缓存全文

缓存时间: 2026/06/30 15:43

Wiki 记忆

智能体的记忆仍处于早期阶段,几乎没有统一标准。“记忆”对每个人意味着不同的东西。但一种常见模式正在浮现:Wiki 记忆

思路很简单:用一个智能体将原始源数据转化为紧凑、持久、可供智能体读取的知识层。

为什么用 Wiki?

原始数据包含大量知识,但直接暴露给智能体往往效率低下。日志、笔记、代码、文档、实验、Slack 线程和转录内容过于嘈杂且体积庞大。因此,我们改为对这些数据运行一个处理流程,将其转化为更密集的表示。

这与基础的 RAG 不同。RAG 通常在查询时检索原始片段。而 Wiki 会预先计算并维护一个更高层次的综合,这样智能体就不必每次都重新发现结构。

这种需求几乎无处不在。当与一家研究公司的朋友交谈时,他谈到了研究人员头脑中的所有知识。他想“克隆他们的大脑”,这样即使他们离开,知识仍然留在公司。他希望通过查看他们运行的实验、写的笔记和采取的行动,能够近似实现这种“大脑克隆”。

Wiki 就是实现这一目标的一种实用方式:不是存储一切,而是将重要内容压缩成一个可重复使用的知识库。

什么是“Wiki”?

Wiki 是一种由智能体维护的数据结构,以对智能体友好的方式表示源知识。

在实践中,这通常意味着对一个源材料运行一个智能体,并要求它创建一组文件,供未来的智能体用于更快地理解该领域。

关键不在于它字面上看起来像维基百科。关键在于它持久、结构化、可检查,并随时间不断更新。

Wiki 的例子

Cognition 的 DeepWiki 可能是我记忆中看到的第一个例子。DeepWiki 为 GitHub 仓库生成 AI 生成的文档。它旨在为人类和编码智能体提供代码库更高级别的思维导图,使其更容易理解和导航。

Karpathy 最近写了一篇关于他所谓的“LLM Wiki”或“LLM 知识库”的文章。这是同一模式更通用的形式:不仅限于代码,还可以处理任意源文件。他的框架是,LLM 增量式构建并维护一个持久的 Markdown 格式的 Wiki,位于用户和原始源之间。

Factory 推出了 AutoWiki,作为类似 DeepWiki 的产品。AutoWiki 分析代码库并生成结构化、可浏览的文档,随着仓库的变化保持最新状态。

这种模式也与 LangMem、Letta、Mem0 和 Zep 等记忆系统相邻。这些系统解决更广泛的智能体记忆问题,而 Wiki 记忆之所以引人注目,是因为它通常使用最简单的底层:文件。

每个领域都有一个 Wiki

我认为,对于每个领域,都会有一个值得你创建的知识库。这个知识库不是仅仅是原始数据。它是原始数据的智能压缩版本。

这里有许多开放问题:

  • 原始数据是什么?
  • 压缩数据的最佳格式是什么?
  • 数据应该如何压缩?
  • 压缩表示应该如何保持更新?

我们开始看到一些常见答案出现:

  • 原始数据是什么?→ 任何智能体可以读取或访问的内容
  • 压缩数据的最佳格式是什么?→ 文件
  • 如何压缩数据?→ 一个智能体
  • 如何维护它?→ 一个智能体

文件之所以有吸引力,是因为它们可检查、可编辑、可版本控制,并且易于智能体读写。

Wiki 并非记忆的全部。它们最适合持久领域知识,而不一定是短期对话状态、用户偏好或高频事件日志。但对于许多领域,Wiki 记忆可能是我们拥有的最简单实用的长期记忆模式。

相似文章

@appliedcompute: https://x.com/appliedcompute/status/2052826576723841292

X AI KOLs Timeline

Applied Compute 推出 ACL-Wiki,这是一个基于其 Context Engine 构建的持续学习记忆系统,能够记录来自 Cursor、Claude Code 和 Codex 的编程智能体交互,从而构建一个不断优化的 Contextbase,在两周内将关键记忆率提升约一倍。该系统通过 MCP 服务器暴露的 Remember-Refine-Retrieve 流水线,为编程智能体提供随使用而持续改进的机构记忆。