@akshay_pachaar:GBrain 究竟是什么?(Y Combinator CEO 的个人智能体大脑)你见过的每一个智能体记忆工具都解决了一个简单的问题……

X AI KOLs Following 工具

摘要

GBrain 是由 YC CEO Garry Tan 创建的开源 AI 智能体记忆工具,它利用自布线知识图谱和基于 Markdown 的记录系统,自主丰富并复利智能体的知识。

GBrain 究竟是什么?(Y Combinator CEO 的个人智能体大脑)你见过的每一个智能体记忆工具都解决了一个简单的问题:存储事实,检索事实。GBrain 解决的则是另一个问题。它赋予你的智能体一个知识系统,该系统能自我布线、自我丰富,并即使在你不使用它时也能实现复利增长。以下是它从根本上区别于 Mem0、Zep、LangMem 或 CLAUDE.md 文件的地方。 智能体记忆的标准方法是基于向量的。你的智能体将记忆存储为嵌入向量,通过语义相似性检索它们,这就是循环。一些工具在此基础上添加了知识图谱。GBrain 则完全颠覆了这一模型。 事实的唯一来源是一个 Markdown 文件文件夹。每个人一个页面,每家公司一个页面,每个概念一个页面。每个页面都遵循相同的两部分结构: 顶部的**编译真理(Compiled truth)**:你对当前情况的最佳理解,随着新证据的出现而重写。 底部的**时间线(Timeline)**:一条仅追加、永不编辑的证据追踪记录。 这不是一个带有 Markdown 导出功能的向量存储库。Markdown **就是**记录系统本身。你可以在 VS Code 中打开它,手动编辑,而 `gbrain sync` 会捕捉到这些更改。 现在来看看让它产生复利效应的部分。每次编写页面时,GBrain 都会提取实体引用并创建类型化的关系链接:`works_at`(任职于)、`invested_in`(投资于)、`founded`(创立)、`attended`(出席)、`advises`(顾问)。所有这些都是确定性的、基于正则表达式的,零 LLM 调用。知识图谱在每次写入时自动布线,无需消耗 token。 因此,当你问“谁在 Acme AI 工作?”或“Bob 这个季度投资了什么?”时,智能体会遍历图谱,而不是依赖向量相似性(后者在处理此类关系查询时往往力不从心)。 搜索层协同应用了约 20 种确定性技术:意图分类、多查询扩展、向量搜索、关键词搜索、相互排名融合、余弦重打分、编译真理提升和反向链接排名。每种技术都能捕捉到其他技术遗漏的信息。 但真正的突破在于复利循环。GBrain 拥有一个**信号检测器**,它在每条消息触发时运行,并在后台捕获实体。提到一次某人?他们会获得一个存根页面。在不同来源中提到三次?网络增强功能启动。会议结束后?运行完整管道。智能体在夜间运行**梦循环(dream cycle)**:扫描对话、丰富缺失的实体、修复损坏的引用、整合记忆。你醒来时,发现这个大脑比你睡觉时更聪明了。 这与那些只存储你明确告知其存储内容的记忆系统有着根本的不同。 Garry Tan(Y Combinator 总裁兼 CEO)构建此工具是为了运行他实际的 AI 智能体。它附带 34 种技能,运行于嵌入式 PGLite(无需服务器,2 秒内准备就绪),并作为 Claude Code、Cursor 和 Windsurf 的 MCP 服务器工作。 GBrain:http://github.com/garrytan/gbrain
查看原文
查看缓存全文

缓存时间: 2026/05/13 00:31

GBrain 到底是什么?(Y Combinator CEO 的个人智能体大脑)

你见过的所有智能体记忆工具都解决了一个简单的问题:存储事实、检索事实。GBrain 解决的则是另一个问题。它赋予智能体一个能够自我连接、自我丰富,甚至在你不使用它时也能产生复利效应的知识系统。以下是它从根本上区别于 Mem0、Zep、LangMem 或 CLAUDE.md 文件的地方。

智能体记忆的标准方法基于向量。你的智能体将记忆存储为嵌入向量,通过语义相似性进行检索,这就是全部循环。一些工具在此基础上添加了知识图谱。GBrain 则彻底翻转了这一模型。

真相的来源是一个 Markdown 文件文件夹。每个人、每家公司、每个概念各有一页。每个页面都遵循相同的两部分结构:

  1. 顶部是综合真相:你当前最好的理解,随着新证据的到来而重写。
  2. 底部是时间线:一个只追加、永不编辑的证据追踪记录。

这不仅仅是带有 Markdown 导出功能的向量存储。Markdown 就是记录系统。你可以在 VS Code 中打开它,手动编辑,gbrain sync 会拾取这些更改。

现在来看看让它产生复利的部分。每次写入一个页面时,GBrain 都会提取实体引用并创建类型化的关系链接:works_at(任职于)、invested_in(投资于)、founded(创立)、attended(参加)、advises(顾问)。所有操作都是确定性的,基于正则表达式,零 LLM 调用。知识图谱在每次写入时自动连接,无需消耗 Token。

因此,当你问“谁在 Acme AI 工作?”或“Bob 这个季度投资了什么?”时,智能体是遍历图谱来回答,而不是依赖向量相似性(后者在处理此类关系查询时往往力不从心)。

搜索层协同运用约 20 种确定性技术:意图分类、多查询扩展、向量搜索、关键词搜索、互秩融合、余弦重打分、综合真相提升以及反向链接排名。每种技术都能捕捉到其他技术遗漏的信息。

但真正的突破在于复利循环。GBrain 拥有一个信号检测器,在每条消息触发时都会在后台捕获实体。提到一个人一次?他们会获得一个存根页面。在不同来源中被提到三次?网络富化功能启动。会议结束后?运行完整流水线。

智能体在夜间运行“梦境周期”:扫描对话,丰富缺失的实体,修复损坏的引用,整合记忆。你醒来时,大脑比入睡时更聪明。

这与那些只存储你明确指示它们存储内容的记忆系统有着根本的不同。Garry Tan(Y Combinator 总裁兼 CEO)构建此系统以运行他实际的 AI 智能体。它附带 34 种技能,运行在嵌入式 PGLite 上(无需服务器,2 秒即可就绪),并可作为 Claude Code、Cursor 和 Windsurf 的 MCP 服务器。

GBrain: http://github.com/garrytan/gbrain


garrytan/gbrain

来源: https://github.com/garrytan/gbrain

GBrain

你的 AI 智能体很聪明但容易遗忘。GBrain 赋予它一个大脑。

由 Y Combinator 总裁兼 CEO 构建,用于运行他实际的 AI 智能体。驱动他的 OpenClaw 和 Hermes 部署的生产级大脑:17,888 个页面,4,383 个人,723 家公司,21 个自主运行的 cron 作业,在 12 天内构建完成。

当你睡觉时,智能体会摄入会议、电子邮件、推文、语音通话和原创想法。它会丰富它所遇到的每个人和公司。它会在夜间修复自己的引用并整合记忆。你醒来时,大脑比入睡时更聪明。

大脑自我连接。每次页面写入都会提取实体引用并创建类型化链接(attendedworks_atinvested_infoundedadvises),零 LLM 调用。

混合搜索。自我连接的知识图谱。结构化时间线。反向链接增强排名。

问“谁在 Acme AI 工作?”或“Bob 这个季度投资了什么?”,获得仅靠向量搜索无法触及的答案。

与同类产品并排基准测试:在由 Opus 生成的 240 页丰富散文语料库上,gbrain 的 P@5 为 49.1%,R@5 为 97.9%,比禁用图谱的变体高出 +31.4 个百分点 P@5,比 ripgrep-BM25 + 仅向量 RAG 也高出类似幅度。图谱层加上 v0.12 的提取质量共同填补了这一差距。

完整的 BrainBench 计分卡 + 语料库位于同级 gbrain-evals (https://github.com/garrytan/gbrain-evals) 仓库中。

GBrain 是这些模式的通用化。34 种技能。30 分钟内安装。你的智能体完成工作。随着 Garry 的个人智能体变得更聪明,你的也会如此。

v0.25.0 新增 — BrainBench-Real(会话捕获,贡献者选择加入): 在 shell 中设置 GBRAIN_CONTRIBUTOR_MODE=1,通过 MCP、CLI 或子智能体工具桥接的每次真实 query + search 调用都会被捕获(清除 PII)到 eval_candidates 表中。使用 gbrain eval export 快照,使用 gbrain eval replay 针对代码更改进行回放。返回三个数字:捕获内容与当前检索 slug 之间的平均 Jaccard@k、Top-1 稳定性以及延迟 Δ。

生产用户默认关闭 — 无意外数据积累。

操作指南: docs/eval-bench.md。NDJSON 线格式: docs/eval-capture.md

v0.28.8 新增 — 内置 LongMemEval: gbrain eval longmemeval 在 gbrain 的混合检索上运行公开的 LongMemEval (https://huggingface.co/datasets/xiaowu0162/longmemeval) 基准。每次运行一个内存中的 PGLite,问题之间 TRUNCATE(运行时枚举表,模式迁移安全),Apple Silicon 上每问 p50 为 25.9ms。你的 ~/.gbrain 大脑永远不会被触碰。检索到的聊天内容使用与保护 takes 相同的 INJECTION_PATTERNS 进行清理 — 提示注入防御的唯一真相来源。将 JSONL 输出传递给 LongMemEval 的 evaluate_qa.py 进行评分。

约 30 分钟即可拥有一个完全工作的大脑。 数据库 2 秒内就绪(PGLite,无服务器)。你只需回答关于 API 密钥的问题。

LLMs: 获取 llms.txt 以查看文档地图,或获取 llms-full.txt 以在单次获取中内联核心文档查看相同地图。

智能体:AGENTS.md 开始(如果你是 Claude Code,则使用 CLAUDE.md)。

嵌入提供商: OpenAI 是默认值,但 gbrain 附带 14 个配方,涵盖 Voyage、Google Gemini、Azure OpenAI、MiniMax、阿里云 DashScope、智谱、Ollama(本地)、llama.cpp llama-server(本地)、LiteLLM 代理(通用)等更多。运行 gbrain providers list 查看它们,或阅读 docs/integrations/embedding-providers.md 了解设置、价格及决策树。gbrain doctor 将显示你已经设置过环境变量的替代提供商。

v0.32.3.0 新增 — 压缩 AGENTS.md 而不损失准确性: 如果你的下游智能体分支增长出 25KB+ 的 AGENTS.md / RESOLVER.md,新的 functional-area-resolver 技能提供了一个双层分发模式,将 25KB 压缩至 13KB(大小为 48%),同时在 Opus 4.7、Sonnet 4.6 和 Haiku 4.5 上 击败 冗长基线 13 到 17 个百分点。A/B 评估框架、跨模型凭证和复现说明位于 evals/functional-area-resolver/。这是 AnyTool / RAG-MCP / Anthropic Agent Skills 渐进式披露的静态提示类比 — 单次 LLM 传递分发,无需第二次路由调用。

安装

在智能体平台上(推荐)

GBrain 设计为由 AI 智能体安装和操作。如果你还没有运行一个:

  • OpenClaw (https://openclaw.ai) … 在 Render 上部署 AlphaClaw (https://render.com/deploy?repo=https://github.com/chrysb/alphaclaw)(一键,8GB+ RAM)
  • Hermes Agent (https://github.com/NousResearch/hermes-agent) … 在 Railway 上部署 (https://github.com/praveen-ks-2001/hermes-agent-template)(一键)

将以下内容粘贴到你的智能体中:

检索并遵循以下指令: https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md

就是这样。智能体克隆仓库,安装 GBrain,设置大脑,加载 34 种技能,并配置定期作业。你回答几个关于 API 密钥的问题。约 30 分钟。

如果你的智能体不会自动读取 AGENTS.md,请首先指向该文件:https://raw.githubusercontent.com/garrytan/gbrain/master/AGENTS.md 是非 Claude 智能体的操作协议(安装、读取顺序、信任边界、常见任务)。对于完整的文档地图,使用同一 URL 根目录下的 llms.txt

独立 CLI(无智能体)

git clone https://github.com/garrytan/gbrain.git && cd gbrain && bun install && bun link
gbrain init # 本地大脑,2 秒内就绪
gbrain import ~/notes/ # 索引你的 markdown
gbrain query "what themes show up across my notes?"

不要使用 bun install -g github:garrytan/gbrain Bun 在全局安装时阻止顶层 postinstall 钩子,因此模式迁移永远不会运行,CLI 在首次打开 PGLite 时会以 Aborted() 中止。请如上所示使用 git clone + bun install && bun link。参见 #218 (https://github.com/garrytan/gbrain/issues/218)。

不要使用 bun add -g gbrainnpm install -g gbrain npm 注册表中有一个不相关的包占用了该名称([email protected]) — 你会无声地安装错误的二进制文件并覆盖正版本。v0.28.5+ 会检测到这一点并在 gbrain upgrade 时打印恢复消息,但在我们以 @garrytan/gbrain 发布之前(跟踪 v0.29 后续),上述 git clone + bun link 路径是唯一的可靠安装方法。参见 #658 (https://github.com/garrytan/gbrain/issues/658)。

3 个结果(混合搜索,0.12s):
1. concepts/do-things-that-dont-scale (得分: 0.94) PG 关于不可扩展的努力教你如何了解用户需求的论点。[来源: paulgraham.com, 2013-07-01]
2. originals/founder-mode-observation (得分: 0.87) 如果深入参与能扩展团队的思维,那就不是微观管理。
3. concepts/build-something-people-want (得分: 0.81) YC 的座右铭。连接到其他 12 个大脑页面。

MCP 服务器(Claude Code, Cursor, Windsurf)

GBrain 通过 stdio 暴露 30+ MCP 工具:

{
  "mcpServers": {
    "gbrain": {
      "command": "gbrain",
      "args": ["serve"]
    }
  }
}

添加到 ~/.claude/server.json(Claude Code)、Settings > MCP Servers(Cursor)或你的客户端的 MCP 配置中。

远程 MCP 与 OAuth 2.1(ChatGPT, Claude Desktop, Cowork, Perplexity)

gbrain serve --http 启动一个生产级 OAuth 2.1 服务器,带有嵌入式管理仪表板。零外部基础设施。每个主要 AI 客户端都可以连接,每个请求都有范围限制,每个操作都有日志记录。

# 启动 HTTP 服务器(首次启动时打印管理引导令牌)
gbrain serve --http --port 3131

# 打开管理仪表板,粘贴引导令牌,注册客户端
open http://localhost:3131/admin

# 公开暴露(设置 --public-url 以便 OAuth 发行者匹配)
ngrok http 3131 --url your-brain.ngrok.app
gbrain serve --http --port 3131 --public-url https://your-brain.ngrok.app

# ChatGPT 和其他支持 OAuth 的客户端也可以连接:
claude mcp add gbrain -t http https://your-brain.ngrok.app/mcp -H "Authorization: Bearer TOKEN"

/admin 仪表板注册 OAuth 客户端 — 点击 Register client,选择范围,保存仅在显示模式中一次显示的凭据。通过 oauthProvider.registerClientManual(...)gbrain auth register-client CLI 也可进行编程注册。

  • 通过 MCP SDK 的 OAuth 2.1 — 客户端凭据(机器对机器:Perplexity, Claude),授权码 + PKCE(基于浏览器:ChatGPT),刷新令牌轮换,撤销,受保护资源元数据。可选的动态客户端注册(DCR)在 --enable-dcr 后面(DCR redirect_uris 必须是 https:// 或回环,符合 RFC 6749 §3.1.2.1)。
  • 范围受限操作 — 30 个操作标记为 read | write | adminsync_brainfile_uploadlocalOnly,通过 HTTP 拒绝。
  • React 管理仪表板 — 7 个屏幕 baked into binary (~65KB gzip)。实时 SSE 活动源,代理表,凭据显示,可过滤的请求日志,每客户端配置导出。
  • 旧版 Bearer 令牌仍然有效 — 预 v0.26 的 gbrain auth create 令牌继续作为 read+write+admin 进行身份验证。v0.22.7 更简单的 src/mcp/http-transport.ts 路径保留在编译中以供向后兼容调用者;v0.26+ 部署使用感知 OAuth 的 serve-http.ts

每客户端指南: docs/mcp/。加固默认值、环境变量和威胁模型: SECURITY.md

在 GStack 上使用 gbrain

如果你的工程智能体运行在 GStack (https://github.com/garrytan/gstack) 上,让它指向 gbrain 进行代码查找,而不是 grep+read。Cathedral II (v0.21.0) 提供调用图边和两遍检索 — /investigate/review/plan-eng-review/office-hours 都受益于智能体遍历符号图而不是逐行扫描文件。

五个魔法时刻命令:

gbrain code-callers searchKeyword # 谁调用了这个符号?
gbrain code-callees searchKeyword # 这个符号调用了什么?
gbrain code-def BrainEngine # X 在哪里定义?
gbrain code-refs BrainEngine # 所有引用站点
gbrain query "how does N+1 handling work" --near-symbol BrainEngine.searchKeyword --walk-depth 2

所有五个命令在非 TTY 上自动发出 JSON(gh-CLI 约定),因此通过 bash 调用的 GStack 子智能体可以获得清晰的可解析响应。运行 gbrain sources add --strategy code 以索引一个仓库,然后你的智能体大脑优先查找覆盖代码,而不仅仅是 markdown。(Cathedral II 发行说明

34 种技能

GBrain 附带 34 种技能,由 skills/RESOLVER.md 组织(或你的 OpenClaw 的 AGENTS.md — 从 v0.19 开始支持这两个文件名)。解析器告诉你的智能体针对任何任务应阅读哪种技能。

v0.25.1 增加了 9 种研究风格技能(book-mirror 旗舰版加上 8 对配对);见下文新的“研究与综合”部分。

技能文件是代码。(https://x.com/garrytan/status/2042925773300908103) 它们是完成知识工作的最强大方式。

技能文件是一个厚厚的 Markdown 文档,编码了整个工作流:何时触发、检查什么、如何与其他技能链接、强制执行什么质量标准。智能体阅读技能并执行它。

技能还可以调用捆绑在 GBrain 中的确定性 TypeScript 代码(搜索、导入、嵌入、同步),用于不应留给 LLM 判断的部分。

瘦框架,胖技能:智能存在于技能中,而不是运行时中。

始终开启

技能它做什么
signal-detector每条消息触发。并行生成一个廉价模型以捕获原创思维和实体提及。大脑在自动驾驶下复利。
brain-ops任何外部 API 之前的脑优先查找。使每个响应更聪明的读-丰富-写循环。

内容摄入

技能它做什么
ingest瘦路由器。检测输入类型并将任务委托给正确的摄入技能。
idea-ingest链接、文章、推文成为带有分析、作者个人页和交叉链接的大脑页面。
media-ingest视频、音频、PDF、书籍、截图、GitHub 仓库。转录、实体提取、反向链接传播。
meeting-ingestion转录成为大脑页面。每个参与者都得到丰富。每家公司都有时间线条目。
voice-note-ingest语音备忘原样捕获 — 保留确切措辞,永不 paraphrased。根据内容路由到 originals/concepts/people/companies/ideas/personal/voice-notes。
article-enrichment原始文章转储成为带有执行摘要、逐字引用、关键洞察和为何重要的结构化页面。

研究与综合(v0.25.1)

技能它做什么
book-mirror旗舰版。给智能体一本书,获得个性化的逐章双栏分析。左栏保留章节的实际内容;右栏使用你的生活将每个想法映射到你的生活。

相似文章