rag

#rag

为什么大多数法律 AI 演示在生产环境中失败

Reddit r/ArtificialInteligence ↗ · 1小时前

本文详细阐述了法律 AI 系统在生产环境中面临的三种常见故障模式：将所有来源视为同等可信、无法处理相互矛盾的法律观点，以及缺乏特定律所的内部知识。文章提出了诸如权威性加权、分歧检测以及注释层等解决方案，以建立系统的可信度与实用性。

0 人收藏 0 人点赞

#rag

@akshay_pachaar: 朴素 RAG vs. Blockify！一种全新的 RAG 方案：- 语料库体积缩减 40 倍 - 每次查询 token 用量减少 3 倍 -…

X AI KOLs Following ↗ · 6小时前缓存

Blockify 是一个新的开源 RAG 框架，以专利技术「IdeaBlocks」流水线取代传统分块方式，声称可实现语料库体积缩减 40 倍、token 使用效率提升 3 倍、向量搜索准确率提升 2.3 倍。它将企业文档转化为结构化 XML 知识单元，以实现更连贯的 LLM 检索效果。

0 人收藏 0 人点赞

#rag

我们构建并开源了 Caliby：一款面向 AI Agent 的嵌入式高性能向量数据库（性能是 pgvector 的 4 倍，磁盘性能超越 FAISS） --- ## 背景我们在构建 AI Agent 时，一直在为向量存储苦苦寻觅合适的方案。 - pgvector 性能太慢，且需要运行一个完整的 PostgreSQL 实例 - FAISS 速度很快，但完全基于内存，无法持久化，而且 API 非常底层，难以使用 - Chroma / Qdrant / Weaviate 功能强大，但都是独立的服务，对于嵌入式使用场景来说过于重量级我们真正需要的是类似 SQLite 的东西——一个无需独立服务、直接嵌入应用程序的向量数据库，同时兼顾速度与易用性。于是，我们动手构建了它。 --- ## Caliby 是什么？ Caliby 是一款嵌入式向量数据库，专为 AI Agent 和本地 AI 应用设计。核心特性： - 🚀 高性能 — 查询速度是 pgvector 的 4 倍，磁盘模式下超越 FAISS - 💾 嵌入式 — 无需独立服务，像使用 SQLite 一样简单 - 🔍 混合搜索 — 同时支持向量搜索与元数据过滤 - 📦 持久化存储 — 数据落盘，重启后不丢失 - 🔧 简洁 API — 专为开发者体验而设计 --- ## 快速上手 ```python from caliby import VectorDB # 初始化数据库（本地文件存储） db = VectorDB("my_agents_memory.db") # 插入向量 db.insert( id="doc_1", vector=[0.1, 0.2, 0.3, ...], metadata={"source": "arxiv", "topic": "AI"} ) # 语义搜索 results = db.search( query_vector=[0.1, 0.2, 0.3, ...], top_k=5, filter={"topic": "AI"} ) ``` --- ## 性能基准测试我们在 100 万条向量、维度为 1536（OpenAI embedding 维度）的数据集上进行了测试： | 数据库 | 查询延迟（P50） | 查询延迟（P99） | 内存占用 | |--------|----------------|----------------|----------| | Caliby | 2.1ms | 4.8ms | 低 | | pgvector | 8.7ms | 21.3ms | 高 | | FAISS（内存模式） | 1.9ms | 3.2ms | 非常高 | | FAISS（磁盘模式） | 6.4ms | 15.7ms | 低 | > FAISS 内存模式确实更快，但需要将全部数据加载到 RAM 中。Caliby 在磁盘模式下实现了接近内存的速度。 --- ## 技术实现 Caliby 的底层采用以下技术： - HNSW 索引（Hierarchical Navigable Small World）用于近似最近邻搜索 - 内存映射文件（mmap）实现高效磁盘访问 - Rust 核心引擎，通过 Python 绑定暴露接口 - WAL（预写日志）保障数据持久化与崩溃恢复 --- ## 适用场景 - 🤖 AI Agent 记忆系统 — 让 Agent 记住过去的对话与经验 - 📚 RAG 应用 — 检索增强生成的本地知识库 - 🔍 语义搜索 — 为应用添加语义检索能力 - 🧪 原型开发 — 无需部署复杂基础设施，快速验证想法 --- ## 开源地址项目已在 GitHub 开源，欢迎 Star、提 Issue 或参与贡献： 👉 [github.com/caliby-db/caliby](https://github.com/caliby-db/caliby) --- 我们很想听听大家的想法： - 你们目前在 AI 项目中使用什么向量数据库？ - 有哪些功能是你们最迫切需要的？欢迎在评论区留言交流！🙌

Reddit r/LocalLLaMA ↗ · 8小时前

Caliby 是由 Sea-Land AI 与麻省理工学院 Michael Stonebraker 团队联合开发的开源嵌入式向量数据库，提供高性能向量检索能力（速度比 pgvector 快 4 倍），支持 HNSW、DiskANN 和 IVF+PQ 索引，专为 AI Agent 和 RAG 场景设计，只需通过 pip install 即可快速安装使用。

0 人收藏 0 人点赞

#rag

@nuannuan_share: 如果我要在90天内找到一份20万美元的AI工程师工作，我不会去读学位。我会精通这10个GitHub仓库。 1. awesome-llm-apps 生产级AI指南。RAG、智能体、多模态应用，附完整代码。10.6万+ stars。仓库 …

X AI KOLs Timeline ↗ · 10小时前缓存

一篇中文社交媒体帖子推荐了10个GitHub仓库，声称掌握这些仓库可在90天内帮助找到20万美元的AI工程师工作，涵盖LangChain、LangGraph、CrewAI、Ollama、Qdrant等主流AI开发框架和工具。

0 人收藏 0 人点赞

#rag

@WY_mask: 目前GitHub热门榜第一，4万+收藏 https://github.com/ruvnet/ruflo 一个“AI调度中心”，可以一次性召唤几十个Agent协同工作，支持多智能体协作、RAG记忆、分布式工作流，甚至还能和Claude Co…

X AI KOLs Timeline ↗ · 10小时前缓存

Ruflo（前身为Claude Flow）是一个GitHub热门开源项目，支持同时调度100+专业AI Agent协同工作，具备RAG记忆、分布式工作流和企业安全功能，并可与Claude Code及Codex直接联动。该项目目前在GitHub热门榜排名第一，获得4万+收藏。

0 人收藏 0 人点赞

#rag

@QingQ77: 把公司文档自动整理成知识 Wiki，通过 MCP 让每个员工的 AI 客户端拿到对口的上下文，不用再手动粘贴。 https://github.com/nduckmink/arkon Arkon 是可自部署的企业 AI 知识中枢。上传 SO…

X AI KOLs Timeline ↗ · 11小时前缓存

Arkon 是一款可自部署的企业 AI 知识中枢，能将公司文档自动编译成交叉链接的知识 Wiki，并通过 MCP 协议让员工的 AI 客户端（如 Claude Desktop）按权限自动获取相关上下文，无需手动粘贴文档。

0 人收藏 0 人点赞

#rag

@AIExplorerTim: 有人刚刚开发了一个工具，可以将 PDF 转换为干净、结构化的 Markdown 速度达到 100 页/秒不需要 GPU。不需要 API 成本。没有混乱的解析。只有原始的、可用的数据。它可以轻松处理的内容： • 表格 → 完美提…

X AI KOLs Timeline ↗ · 12小时前缓存

OpenDataLoader 是一个开源工具，可将 PDF 转换为结构化的 Markdown 和 JSON，支持 100 页/秒的本地处理速度，无需 GPU 或 API 成本，专为 RAG 管道和 PDF 无障碍自动化设计。

0 人收藏 0 人点赞

#rag

我为编码智能体的“记忆”构建了一个基准测试，期待他人来挑战它

Reddit r/artificial ↗ · 16小时前

开发者创建了一个名为 continuity-benchmarks 的新基准测试，用于测试 AI 编码智能体在活跃开发过程中保持与项目规则一致性的能力，解决了现有记忆基准测试的空白——这些测试侧重于语义回忆而非实时架构一致性和多会话行为。

0 人收藏 0 人点赞

#rag

@no_stp_on_snek: https://x.com/no_stp_on_snek/status/2052833502475833384

X AI KOLs Following ↗ · 18小时前缓存

使用 Qwen2.5-32B-Instruct 搭配 longctx 和 vllm-turboquant 的单个 AMD MI300X 开源技术栈，在 MRCR v2 百万级上下文基准测试中取得了与 SubQ 闭源模型（0.659）相竞争的结果（0.601-0.688），表明开源权重方法已接近达到同等水平。

0 人收藏 0 人点赞

#rag