@hasantoxr: 我在自己的笔记本电脑上搭建了一个RAG系统，绝不会向OpenAI发送一个字节。100%离线。100%开源。以下是……

X AI KOLs Timeline 2026/06/16 21:50 工具

rag retrieval-augmented-generation offline open-source local-ai tutorial

摘要

一位用户在自己的笔记本电脑上搭建了一个完全离线、完全开源的RAG系统，强调不会向OpenAI发送任何数据。他们提供了一个6步指南。

我在自己的笔记本电脑上搭建了一个RAG系统，绝不会向OpenAI发送一个字节。 100%离线。100%开源。以下是用简单英语描述的整个6步构建过程：

查看原文

查看缓存全文

缓存时间: 2026/06/17 01:44

我在自己的笔记本电脑上构建了一个 RAG 系统，从未向 OpenAI 发送过一个字节。

100% 离线。100% 开源。

以下是完整的 6 步构建过程，通俗易懂：

首先，什么是 RAG？

它意味着让 AI 访问你自己的文件。

与其问 ChatGPT 并希望它知道答案，不如让它指向你的 PDF、笔记和邮件。它会读取这些内容，然后根据你的资料来回答。

与“与你的 PDF 对话“是同一个概念，但它运行在你的笔记本电脑上，且没有数据离开你的机器。

第 1 步：安装 Ollama。

这是在你笔记本电脑上运行 AI 模型的引擎。

你只需下载一次。适用于 Mac、Windows 和 Linux。免费。无需注册。

它叫 Ollama。可以把它想象成 AI 模型的 Spotify。你选择一个模型，它就直接运行。

第 2 步：下载一个模型。

打开终端并输入：

ollama pull llama3.1

就这样。你现在有一个真正的 AI 模型在你的笔记本电脑上运行。没有 OpenAI。没有互联网。没有 API 密钥。

Llama 3.1 是 Meta 的开源模型。免费。好用。在大多数 8GB 以上内存的笔记本电脑上都能运行。

第 3 步：安装 AnythingLLM。

这是一个为你完成繁重 RAG 工作的应用。

你可以拖入你的 PDF、Word 文档、笔记和网站。它会读取它们。它会记住它们。你可以与它们对话。

它叫 AnythingLLM。100% 开源。

第 4 步：将 AnythingLLM 连接到 Ollama。

在 AnythingLLM 中，进入设置。选择“Ollama“作为你的 AI 提供者。选择你下载的模型。

完成。你的私人 ChatGPT 现在已经连上了。

AI 在本地运行。文件保留在本地。没有任何内容被上传到任何地方。

第 5 步：放入你的文件。

拖放即可。PDF、Word 文档、Markdown、CSV、网站，甚至是 YouTube 转录。

AnythingLLM 会将它们切分成可搜索的片段，并存储在你的机器上。

你可以将 10,000 个文档放进去。在几秒钟内搜索其中任何一个。

第 6 步：向它提问。

现在你可以问类似这样的问题：

→ “我的医生对化验结果说了什么？” → “总结第 47 页的合同。” → “找出客户提到截止日期的所有邮件。”

它会从你的文件中提取相关部分，并附上来源进行回答。

完整的工具栈：

→ Ollama（运行 AI） → Llama 3.1（AI 本身） → AnythingLLM（界面 + RAG）

3 个工具。全部免费。全部开源。全部在你的笔记本电脑上运行。

没有订阅。没有数据发送给 OpenAI、谷歌或其他任何人。

你的笔记本电脑完成所有工作。如果你有一台 4GB 的老机器，较小的模型仍然可以运行，但会很慢。

8GB 内存是最低要求。16GB 是最佳选择。M 系列 Mac 或任何现代 PC 都能很好地工作。

这就是唯一的成本。你现有的那台机器。

感谢阅读。

相似文章

@tom_doerr: 构建RAG系统的分步指南笔记本 https://github.com/langchain-ai/rag-from-scratch…

X AI KOLs Timeline

一个从头构建RAG系统的分步笔记本系列，涵盖索引、检索和生成，并附有视频播放列表。

我们开源了一个代理运行时，专为人们常忽略的部分构建：在真实硬件上离线运行代理

Reddit r/AI_Agents

一个开源的代理运行时，专为在真实硬件上离线运行AI代理而设计，支持硬件I/O（GPIO/MQTT/OPC-UA）作为一级节点和可视化构建器，支持多提供商LLM和本地RAG。

@tom_doerr: 构建生产级RAG系统与Agentic工作流 https://github.com/jamwithai/production-agentic-rag-course…

X AI KOLs Timeline

一个面向学习者的项目，教授构建生产级RAG系统和Agentic工作流，涵盖关键词搜索、混合检索和LangGraph代理集成。

@DivyanshT91162: 每个人都被云端的AI代理分心……与此同时，一些人悄悄地把他们的笔记本电脑变成了自主AI…

X AI KOLs Timeline

描述如何将笔记本电脑变成一台24/7全天候自主AI研究机器，使用 Qwen3-35B-A3B、llama.cpp 和 Unsloth 的4位量化，无需云或GPU服务器。

基于Jetson Orin NX SUPER 16GB打造了一款完全离线运行的行李箱机器人。使用Gemma 4 E4B模型，缓存TTFT约200毫秒，搭载30多个传感器，无WiFi/蓝牙/蜂窝网络连接。它有自己的想法。

Reddit r/LocalLLaMA

一位开发者使用Jetson Orin NX和Gemma 4 E4B模型打造了一款名为Sparky的完全离线行李箱机器人，实现了约200毫秒的缓存TTFT和14-15 tok/s的处理速度，通过30多个传感器以自然语言形式将数据输入提示词，全程无网络连接。

相似文章

@tom_doerr: 构建RAG系统的分步指南笔记本 https://github.com/langchain-ai/rag-from-scratch…

我们开源了一个代理运行时，专为人们常忽略的部分构建：在真实硬件上离线运行代理

@tom_doerr: 构建生产级RAG系统与Agentic工作流 https://github.com/jamwithai/production-agentic-rag-course…

@DivyanshT91162: 每个人都被云端的AI代理分心……与此同时，一些人悄悄地把他们的笔记本电脑变成了自主AI…

基于Jetson Orin NX SUPER 16GB打造了一款完全离线运行的行李箱机器人。使用Gemma 4 E4B模型，缓存TTFT约200毫秒，搭载30多个传感器，无WiFi/蓝牙/蜂窝网络连接。它有自己的想法。

提交意见反馈