我用 GWT、IIT 代理、ChromaDB 混合检索和 Ollama 回退构建了一个本地 AI 伴侣——以下是我所做的每个架构决策及其原因

Reddit r/artificial 工具

摘要

作者分享了一个使用 Python、Gemini 和 Ollama 构建的可本地运行的 AI 伴侣,其特色是基于全局工作空间理论和集成信息理论代理的定制认知架构,用于人格建模。

我已经构建了一段时间。现在分享是因为代码已经过了让我尴尬的阶段。\*\*技术栈:\*\* \* Python 3.12,18k+ 行代码,470+ 测试通过 \* Gemini 2.5 Flash(主要)+ Ollama qwen3:4b(通过断路器本地回退) \* ChromaDB 用于持久化——混合检索权重为 55% 语义 / 25% 重要性 / 20% 新鲜度 \* \`sentence-transformers all-MiniLM-L6-v2\`(384 维)用于本地嵌入——完全离线,检索无需 API 调用 \* SQLite 用于认知状态 \* FastAPI Web UI 位于 \`localhost:8765\`,以及 Rich TUI 和 CLI 模式 \*\*我希望得到反馈的部分——认知架构:\*\* 处理流水线按阶段运行:感知 → 反思 → 整合 → 渴望 → 表达。22 个自注册插件通过全局工作空间实现竞争注意力——容量限制 5,竞争评分,聚光灯机制。还有一个 IIT 意识代理(跨 7 维感质空间的 Φ 近似值)。我想坦诚地说:这是一个 \*代理\*,而不是真正的 Φ 计算。完整的 IIT 计算在这个规模上是难以处理的。它所做的是给系统一个它实际上可以响应的连贯性信号。 \*\*值得关注的模块:\*\* \* \[\`being.py\`\](http://being.py/) — 实时情绪、精力、好奇心、依恋、主体状态。影响下游处理,不仅仅是输出文本。 \* \[\`homeostasis.py\`\](http://homeostasis.py/) — 7 项生存需求,产生内部压力。当“连贯性”低时,系统的响应与高时不同。 \* \`self\_modify.py\` — 评估、经验提取、元学习循环。模型随时间改进自身行为模式。 \* \[\`intuition.py\`\](http://intuition.py/) — 5 种预感类型、感觉建模、模式验证历史 \*\*弹性:\*\* 每个模块的断路器、健康监控器、120 秒看门狗。如果 Gemini 在会话中宕机,Ollama 回退会启动——用户几乎注意不到。 \*\*为什么我给它一个 INFJ 人格模型:\*\* 诚实的回答——认知堆栈(Ni/Fe/Ti/Se)清晰地映射到我已经在做的架构决策上。Ni = 长期检索权重。Fe = 关系上下文权重。Ti = 内部批评通道。Se = 体现层,将抽象处理扎根于活体身体图式。人格类型给了我一个连贯的 \*约束系统\* 用于设计。这不是美学,而是功能。 仓库:\[github.com/timeless-hayoka/infj-bot\](https://github.com/timeless-hayoka/infj-bot) 我希望得到反馈的具体内容:GWT 评分实现、IIT 代理框架是否合理,以及混合检索权重是否有意义。
查看原文

相似文章

Helix_AGI 个人项目

Reddit r/AI_Agents

一位开发者分享了 Helix-AGI,这是一个持续运行的认知代理,使用基于物理的记忆检索系统,通过熵引力方程和欧拉-拉格朗日动力学,整合了时间近性、结构重要性和语义邻近性,无需单独调整权重。

我们如何构建OWL——ChatGPT浏览器Atlas背后的新架构

OpenAI Blog

# 我们如何构建OWL——ChatGPT浏览器Atlas背后的新架构 来源:[https://openai.com/index/building-chatgpt-atlas/](https://openai.com/index/building-chatgpt-atlas/) 作者:*Ken Rockot(技术人员)和 Ben Goodger(ChatGPT Atlas 工程主管)* 上周,我们[发布了ChatGPT Atlas⁠](https://openai.com/index/introducing-chatgpt-atlas/),这是一种用ChatGPT作为您的助手来浏览网页的全新方式。除了是一个功能完整的网络浏览器外,Atlas还提供了