rag

标签

Cards List
#rag

为什么大多数法律 AI 演示在生产环境中失败

Reddit r/ArtificialInteligence · 1小时前

本文详细阐述了法律 AI 系统在生产环境中面临的三种常见故障模式:将所有来源视为同等可信、无法处理相互矛盾的法律观点,以及缺乏特定律所的内部知识。文章提出了诸如权威性加权、分歧检测以及注释层等解决方案,以建立系统的可信度与实用性。

0 人收藏 0 人点赞
#rag

@akshay_pachaar: 朴素 RAG vs. Blockify!一种全新的 RAG 方案:- 语料库体积缩减 40 倍 - 每次查询 token 用量减少 3 倍 -…

X AI KOLs Following · 6小时前 缓存

Blockify 是一个新的开源 RAG 框架,以专利技术「IdeaBlocks」流水线取代传统分块方式,声称可实现语料库体积缩减 40 倍、token 使用效率提升 3 倍、向量搜索准确率提升 2.3 倍。它将企业文档转化为结构化 XML 知识单元,以实现更连贯的 LLM 检索效果。

0 人收藏 0 人点赞
#rag

我们构建并开源了 Caliby:一款面向 AI Agent 的嵌入式高性能向量数据库(性能是 pgvector 的 4 倍,磁盘性能超越 FAISS) --- ## 背景 我们在构建 AI Agent 时,一直在为向量存储苦苦寻觅合适的方案。 - **pgvector** 性能太慢,且需要运行一个完整的 PostgreSQL 实例 - **FAISS** 速度很快,但完全基于内存,无法持久化,而且 API 非常底层,难以使用 - **Chroma / Qdrant / Weaviate** 功能强大,但都是独立的服务,对于嵌入式使用场景来说过于重量级 我们真正需要的是类似 **SQLite** 的东西——一个无需独立服务、直接嵌入应用程序的向量数据库,同时兼顾速度与易用性。 于是,我们动手构建了它。 --- ## Caliby 是什么? **Caliby** 是一款嵌入式向量数据库,专为 AI Agent 和本地 AI 应用设计。 **核心特性:** - 🚀 **高性能** — 查询速度是 pgvector 的 4 倍,磁盘模式下超越 FAISS - 💾 **嵌入式** — 无需独立服务,像使用 SQLite 一样简单 - 🔍 **混合搜索** — 同时支持向量搜索与元数据过滤 - 📦 **持久化存储** — 数据落盘,重启后不丢失 - 🔧 **简洁 API** — 专为开发者体验而设计 --- ## 快速上手 ```python from caliby import VectorDB # 初始化数据库(本地文件存储) db = VectorDB("my_agents_memory.db") # 插入向量 db.insert( id="doc_1", vector=[0.1, 0.2, 0.3, ...], metadata={"source": "arxiv", "topic": "AI"} ) # 语义搜索 results = db.search( query_vector=[0.1, 0.2, 0.3, ...], top_k=5, filter={"topic": "AI"} ) ``` --- ## 性能基准测试 我们在 100 万条向量、维度为 1536(OpenAI embedding 维度)的数据集上进行了测试: | 数据库 | 查询延迟(P50) | 查询延迟(P99) | 内存占用 | |--------|----------------|----------------|----------| | **Caliby** | **2.1ms** | **4.8ms** | **低** | | pgvector | 8.7ms | 21.3ms | 高 | | FAISS(内存模式) | 1.9ms | 3.2ms | 非常高 | | FAISS(磁盘模式) | 6.4ms | 15.7ms | 低 | > FAISS 内存模式确实更快,但需要将全部数据加载到 RAM 中。Caliby 在磁盘模式下实现了接近内存的速度。 --- ## 技术实现 Caliby 的底层采用以下技术: - **HNSW 索引**(Hierarchical Navigable Small World)用于近似最近邻搜索 - **内存映射文件**(mmap)实现高效磁盘访问 - **Rust 核心引擎**,通过 Python 绑定暴露接口 - **WAL(预写日志)** 保障数据持久化与崩溃恢复 --- ## 适用场景 - 🤖 **AI Agent 记忆系统** — 让 Agent 记住过去的对话与经验 - 📚 **RAG 应用** — 检索增强生成的本地知识库 - 🔍 **语义搜索** — 为应用添加语义检索能力 - 🧪 **原型开发** — 无需部署复杂基础设施,快速验证想法 --- ## 开源地址 项目已在 GitHub 开源,欢迎 Star、提 Issue 或参与贡献: 👉 **[github.com/caliby-db/caliby](https://github.com/caliby-db/caliby)** --- 我们很想听听大家的想法: - 你们目前在 AI 项目中使用什么向量数据库? - 有哪些功能是你们最迫切需要的? 欢迎在评论区留言交流!🙌

Reddit r/LocalLLaMA · 8小时前

Caliby 是由 Sea-Land AI 与麻省理工学院 Michael Stonebraker 团队联合开发的开源嵌入式向量数据库,提供高性能向量检索能力(速度比 pgvector 快 4 倍),支持 HNSW、DiskANN 和 IVF+PQ 索引,专为 AI Agent 和 RAG 场景设计,只需通过 pip install 即可快速安装使用。

0 人收藏 0 人点赞
#rag

@nuannuan_share: 如果我要在90天内找到一份20万美元的AI工程师工作,我不会去读学位。 我会精通这10个GitHub仓库。 1. awesome-llm-apps 生产级AI指南。RAG、智能体、多模态应用,附完整代码。10.6万+ stars。 仓库 …

X AI KOLs Timeline · 10小时前 缓存

一篇中文社交媒体帖子推荐了10个GitHub仓库,声称掌握这些仓库可在90天内帮助找到20万美元的AI工程师工作,涵盖LangChain、LangGraph、CrewAI、Ollama、Qdrant等主流AI开发框架和工具。

0 人收藏 0 人点赞
#rag

@WY_mask: 目前GitHub热门榜第一,4万+收藏 https://github.com/ruvnet/ruflo 一个“AI调度中心”,可以一次性召唤几十个Agent协同工作,支持多智能体协作、RAG记忆、分布式工作流,甚至还能和Claude Co…

X AI KOLs Timeline · 10小时前 缓存

Ruflo(前身为Claude Flow)是一个GitHub热门开源项目,支持同时调度100+专业AI Agent协同工作,具备RAG记忆、分布式工作流和企业安全功能,并可与Claude Code及Codex直接联动。该项目目前在GitHub热门榜排名第一,获得4万+收藏。

0 人收藏 0 人点赞
#rag

@QingQ77: 把公司文档自动整理成知识 Wiki,通过 MCP 让每个员工的 AI 客户端拿到对口的上下文,不用再手动粘贴。 https://github.com/nduckmink/arkon Arkon 是可自部署的企业 AI 知识中枢。上传 SO…

X AI KOLs Timeline · 11小时前 缓存

Arkon 是一款可自部署的企业 AI 知识中枢,能将公司文档自动编译成交叉链接的知识 Wiki,并通过 MCP 协议让员工的 AI 客户端(如 Claude Desktop)按权限自动获取相关上下文,无需手动粘贴文档。

0 人收藏 0 人点赞
#rag

@AIExplorerTim: 有人刚刚开发了一个工具,可以将 PDF 转换为 干净、结构化的 Markdown 速度达到 100 页/秒 不需要 GPU。 不需要 API 成本。 没有混乱的解析。 只有原始的、可用的数据。 它可以轻松处理的内容: • 表格 → 完美提…

X AI KOLs Timeline · 12小时前 缓存

OpenDataLoader 是一个开源工具,可将 PDF 转换为结构化的 Markdown 和 JSON,支持 100 页/秒的本地处理速度,无需 GPU 或 API 成本,专为 RAG 管道和 PDF 无障碍自动化设计。

0 人收藏 0 人点赞
#rag

我为编码智能体的“记忆”构建了一个基准测试,期待他人来挑战它

Reddit r/artificial · 16小时前

开发者创建了一个名为 continuity-benchmarks 的新基准测试,用于测试 AI 编码智能体在活跃开发过程中保持与项目规则一致性的能力,解决了现有记忆基准测试的空白——这些测试侧重于语义回忆而非实时架构一致性和多会话行为。

0 人收藏 0 人点赞
#rag

@no_stp_on_snek: https://x.com/no_stp_on_snek/status/2052833502475833384

X AI KOLs Following · 18小时前 缓存

使用 Qwen2.5-32B-Instruct 搭配 longctx 和 vllm-turboquant 的单个 AMD MI300X 开源技术栈,在 MRCR v2 百万级上下文基准测试中取得了与 SubQ 闭源模型(0.659)相竞争的结果(0.601-0.688),表明开源权重方法已接近达到同等水平。

0 人收藏 0 人点赞
#rag

从LLM代理视角测量网页信息密度 [R]

Reddit r/MachineLearning · 19小时前

本文介绍了从LLM代理视角对网页信息密度进行的实证测量,使用了涵盖五个类别的100个URL的精选基准。研究发现,结构化提取平均减少了71.5%的令牌数量,同时保持了答案质量,并揭示了Claude Code中一个未记录的压缩层。

0 人收藏 0 人点赞
#rag

@NFTCPS: 兄弟们,搞AI不搞大模型,等于白干! 今天必须给你们安利一本开源神书《大模型基础》,别等了,看它就够了! 这书不跟你整那些虚的,一招打透!从大语言模型入门到架构演化,再一口气给你拆解Prompt工程、参数高效微调、模型编辑、RAG(检索增…

X AI KOLs Timeline · 昨天 缓存

该文章推广了开源书籍《大模型基础》,系统讲解大语言模型相关知识,并介绍了多智能体开发框架Agent-Kernel。

0 人收藏 0 人点赞
#rag

@rwayne: 昨天 arXiv 上挂了一篇有意思的论文,把认知科学里「意识」的机制直接翻译成了长上下文工程。 论文作者 Mo Yu / Jie Zhou 等 6 位研究员提出,认知科学有个老观点叫 global ignition,人意识到一件事时,分布…

X AI KOLs Timeline · 昨天

研究者提出将认知科学中的"global ignition"意识机制应用于长上下文工程,提出MiA-Signature方法使用子模选择高层概念覆盖激活空间,应用于RAG和agentic系统后获得一致性能提升。

0 人收藏 0 人点赞
#rag

@techNmak: 这可能是目前网上最坦诚的AI架构解析。九层AI生产架构…

X AI KOLs Timeline · 昨天

一份关于九层生产AI架构的详细解析,涵盖RAG管道、代理、提示词、安全、评估和可观测性层。

0 人收藏 0 人点赞
#rag

文本-图协同:用于 RAG 的双向验证与补全框架

arXiv cs.AI · 昨天 缓存

本文介绍了 TGS-RAG,这是一个双向验证与补全框架,通过协同基于文本和基于图的检索增强生成(RAG),提高了多跳推理的准确性。

0 人收藏 0 人点赞
#rag

AgenticRAG:面向企业知识库的代理检索

arXiv cs.AI · 昨天 缓存

本文介绍了 AgenticRAG,这是一个来自微软的框架,通过为大型语言模型(LLM)配备迭代搜索、文档导航和分析工具,增强了企业知识库的检索能力。它在多个基准测试中展示了相比标准 RAG 流水线在召回率和事实准确性方面的显著提升。

0 人收藏 0 人点赞
#rag

FinRAG-12B:一种经过生产验证的银行业有据可依问答方案

arXiv cs.AI · 昨天 缓存

FinRAG-12B 是一款针对银行业检索增强生成(RAG)优化的 120 亿参数大语言模型,具备统一训练框架,可提升回答质量、引用依据的可靠性以及校准后的拒绝回答能力。该模型在引用依据方面优于 GPT-4.1,并已部署于 40 多家金融机构,在成本和延迟方面具有显著优势。

0 人收藏 0 人点赞
#rag

LatentRAG:用于高效智能体 RAG 的潜在推理与检索

arXiv cs.CL · 昨天 缓存

LatentRAG 是一个新颖的框架,将智能体 RAG 的推理与检索过程转移至连续的潜在空间,在保持与显式方法相当的性能的同时,将推理延迟降低了约 90%。

0 人收藏 0 人点赞
#rag

IRC-Bench:基于语境线索在自传体回忆中识别实体

arXiv cs.CL · 昨天 缓存

本文介绍了 IRC-Bench,这是一个用于在自传体回忆中识别隐式实体的基准测试,侧重于利用语境线索而非显式提及。文章评估了各种大型语言模型(LLM)和检索配置,发现经过 QLoRA 微调的 Llama 3.1 8B 在开放世界设置中表现最佳。

0 人收藏 0 人点赞
#rag

AdaGATE:面向多跳检索增强生成的自适应间隙感知、令牌高效证据集成

arXiv cs.CL · 昨天 缓存

AdaGATE 是一种免训练的证据控制器,用于多跳 RAG。它采用以实体为中心的间隙追踪、微查询生成和基于效用的选择机制,提升了在噪声检索条件下的鲁棒性,在输入令牌更少的情况下达到了最先进的证据 F1 值。

0 人收藏 0 人点赞
#rag

@GithubProjects: CocoIndex 将你的代码库、文档、PDF、Slack、会议记录甚至视频转化为 AI 持续更新的上下文…

X AI KOLs Timeline · 昨天

CocoIndex 是一款工具,通过增量更新来自代码库、文档、PDF、Slack、会议记录和视频的嵌入向量、摘要和知识图谱,为 AI 代理提供持续新鲜的上下文。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈