@khemaridh: https://x.com/khemaridh/status/2070294198469968237
摘要
作者描述了自己构建一个自我改进的“公司大脑”,使用了Claude Code和一个markdown文件的wiki,灵感来自Andrej Karpathy,目的是高效地组织和查询培训材料。
查看缓存全文
缓存时间: 2026/06/26 10:10
我在 Claude Code 中构建了一个能自我改进的“公司大脑“
每有新模型发布,我都会立刻把它指向一个装了大量上下文的大文件夹,然后开始问一些非常棘手的问题。
当我开始使用 Claude Cowork 后,我注意到(和 Claude Projects 不同)它不再有文件数量限制。
哈利路亚!
但不幸的是,这并不意味着我可以直接使用臃肿的文件和文件夹结构——LLM 仍然受限于有限的上下文窗口,难以处理大量文件。
而这个问题在知识工作中会更加严重,因为你不断在吸收新信息。
我学到的是,LLM 和智能体在浏览大量上下文时采用的是“暴力“方式。这种方法可行,但会消耗大量 token,而且可能会遗漏很多关键信息。
好在有个解决方案,来自 Anthropic 研究员 Andrej Karpathy。Karpathy 提出了一种简单而优雅的方法,利用文件夹、Markdown 文件和 Claude 技能,构建一个能自我改进的“公司大脑“。
你想让 AI 为你的公司工作吗?
加入两位经验丰富的 AI 咨询公司创始人的坦诚对话,聊一聊我们听腻了的 AI 陈词滥调、拖累团队的信念,以及没有人愿意说出口的令人不安的真相。
👉 加入免费活动
构建我的 Wiki LLM
这个项目的完整文档(官方名为“Wiki LLM“)可以通过 GitHub 访问。以下是 Karpathy 的描述:
LLM 并不是在查询时直接从原始文档中检索信息,而是逐步构建并维护一个持久的 wiki——一个结构化的、相互链接的 Markdown 文件集合,位于你和原始资料之间。当你添加新资料时,LLM 不只是将其索引以备后续检索。它会读取资料,提取关键信息,并将其整合到现有的 wiki 中——更新实体页面、修订主题摘要、记录新数据与旧声明相矛盾的地方、强化或挑战不断演进的综合认知。知识一次性编译后持续更新,而不是每次查询都重新推导。
为了测试这种方法,我创建了这个 wiki 来整理和查询过去两年的所有培训材料。以下是我使用的结构:
首先来看一下摄入过程:
-
资料来源: 这些是我直接(例如我的博客教程)或间接(例如 Granola 转录的培训记录)定期创建的所有文档。
-
原始文件: 以原始格式保存为不可变对象。这让我始终能够回退。
-
文件摄入: 将文件转换为 Markdown 格式,方便 LLM 读取(使用一个简单的 Python 脚本)。
-
人在回路中: 我使用“访谈法“来加入我对底层材料的判断。
接下来是自我改进过程(全部采用 Markdown 格式):
-
文档页面: 这是最重要的一步,添加元数据、结构化摘要、重复出现的概念和新想法。
-
索引页面: 一个不断更新的目录,每个资料源附加一行,使每个页面都能在一个地方被发现。
-
链接概念: 这一步使用超链接将新页面与 wiki 的其他部分连接起来(帮助 LLM 导航)。
-
日志页面: wiki 所有操作的时间顺序日记。
文件系统即数据库
LLM 的一个优势是它们喜欢吸收信息来改进输出和决策能力。
上述过程为 LLM 提供了一张非常清晰的地图,帮助它高效地找到正确的上下文。Carter Rabasa 在他的文章《文件系统是 AI 智能体的新原语》中解释了这种方法的价值:
文件系统并不是一个完整的记忆架构,我也不打算假装它是。但对于智能体最难处理的那部分记忆——持久、可检查、可修改的工作上下文——它是一个异常优秀的基底。文件为模型提供了名称、路径、层级结构、时间戳、权限和约定,这些都是模型已经知道如何推理的东西。
超链接帮助 LLM 导航思想
你会看到所有这些页面通过超链接系统相互连接。说实话,我需要更好地理解这在实际中如何运作,但我的假设是 LLM 会先爬取索引页面,然后是摘要页面,最后是原始页面。
ChatGPT 是这样给我解释的:
超链接并不会神奇地将链接页面加载到模型的“大脑“中。它给智能体一条清晰的指令路径:“这个页面存在,它与当前内容相关,你可能需要接下来阅读它。”
技能将所有环节串联起来
摄入技能是一个可重复的过程,通过 Claude 技能运行。它还负责将文件转换为 Markdown。
我可以想象未来这个步骤会完全自动化——但在完全理解其原理之前,我会继续让自己充当“人在回路中“的角色。
清理过程(称为“linting“)
这是最后的维护步骤。它会遍历 wiki,查找可以合并的重复内容、孤立概念和想法。
最终,我会将其变成一个独立的技能,然后通过定时任务运行。
以下是一个 Claude 建议我合并的相关概念的示例。
查询 Wiki
好了,现在该谈谈真正的要点。
这一切的真正目的是什么?是表演性质的?还是真的能为 LaTour AI 及其客户带来实际价值?
我会写一篇更长的关于“评估“的文章——一种持续“评估“LLM 输出的方法。
但就目前而言,我用它来创建定制化的课程大纲、演示文稿和营销材料。
以下是一个相当复杂的任务示例,使用 wiki 生成了非常好的结果。
拿详细的课程大纲,更新以融入最新的想法,尤其是最新的 PPT 和后面的一些培训内容。保留三个部分(基础、Cowork、智能体编程),有 7-10 个模块标题,然后 2-5 个要点作为描述。然后一个要点用于示例和成果。这将成为“最新“版本的课程大纲草稿。一些想到的变化:更强调技能、最后加一个工具部分、拓展幻觉和谄媚的内容、涉及 token 成本。再次强调,主幻灯片最接近事实来源,然后据此扩展。
Wiki 的未来改进
摄入材料已经一周了,以下是评估 wiki 效果的前瞻路线图:
• 更全面的“评估“,对比直接将原始材料扔进 Claude Cowork • 自动化收集文档到“原始“文件夹 • 完善“linting“技能 • 为概念创建一个单独的子表 • 创建一个评估培训中“知识空白“的技能
我很兴奋,因为我看到了一个过程的雏形,它能够以自动化的方式获取专有知识并自我改进。
时间会证明它是否真的能带来改变。
你准备好开始构建个性化 AI 智能体了吗(无需任何代码)?
想象一下周一早上坐下来,你的会议已经准备就绪,收件箱已经分类整理,上周的笔记已经组织好——一切都在你打开笔记本电脑之前完成。这就是按你设定一次的日程运行的 Claude Cowork。这个自定进度的课程教你构建这样一个系统。一个周末就能完成。
👉 一个周末学会 Cowork
相似文章
@cyrilXBT: Andrej Karpathy 搭建了一个与AI协作思考的维基。我构建了一个能回应的系统。Claude Code + Obsidian 等于一个……
一位开发者使用Claude Code和Obsidian构建了一个AI系统,能够永久记住用户的上下文、目标和历史记录,充当随时间累积知识的第二大脑。
@eng_khairallah1: https://x.com/eng_khairallah1/status/2066437136354545981
关于如何使用300个AI智能体群在Obsidian中构建一个自动运行的第二大脑的综合指南,它可以在夜间将原始笔记和文章处理成有序的知识,无需依赖云端。
@rohit4verse: Karpathy的第二大脑是最高杠杆效应的工具,但没人正确使用。它应该每天早上为你简报你错过的联…
一条推文讨论Andrej Karpathy的第二大脑系统,该系统使用Obsidian和Claude Code进行自动知识捕获和每日简报,作为生产力工作流。
@tom_doerr: Claude Code的自我修正记忆与上下文工程 https://github.com/rohitg00/pro-workflow…
Pro Workflow是Claude Code和Cursor的一个插件,它通过SQLite添加了自我修正记忆和持久化Wiki功能,使AI能够从修正中学习并在会话间积累知识。
@undefinedKi: https://x.com/undefinedKi/status/2068306794116501544
一份逐步指南,教你如何通过连接Claude(通过Claude Code)与Obsidian,构建一个AI驱动的第二大脑,实现持久的知识存储、自动链接以及跨所有笔记的查询。