@jerryjliu0:我们很高兴在LlamaParse中引入Retrieval Harness——这是2026年版的文档RAG……

X AI KOLs Timeline 工具

摘要

LlamaIndex在LlamaParse中引入了Retrieval Harness,提供混合检索、文件列表、grep和文件读取等文件系统原语,使AI代理能够可扩展地搜索和遍历文档。

我们很高兴在LlamaParse中引入Retrieval Harness——这是2026年版的文档RAG 通用代理需要一系列合适的工具来可扩展地搜索和读取任意数据集合(从10份文档到100万+份文档)。它们已经能够在本地文件系统上表现出良好的检索性能,但需要一个合适的后端来管理大规模数据集合。Retrieval Harness针对不同需求提供了一套多样化的工具: 1. 混合检索:结合向量搜索与关键词搜索,让代理设置alpha值在两者间切换 2. 列出文件:可扩展版本的`ls`,用于列出索引中的文件 3. 文件Grep:在给定文件中启用正则表达式搜索 4. 文件读取:允许代理读取现有文档中的某个子部分 代理可以选择交错使用这些工具中的任意序列,以完成从简单到困难的各种任务。 快来查看吧! 博客:https://llamaindex.ai/blog/announcing-retrieval-harness?utm_medium=socials&utm_source=twitter&utm_campaign=2026-jun-… 注册LlamaParse:https://cloud.llamaindex.ai
查看原文
查看缓存全文

缓存时间: 2026/06/30 03:35

我们非常激动地宣布,在 LlamaParse 中推出检索工具集——这是 2026 年版的文档级 RAG 方案。

通用智能体需要一套合适的工具,以便在任意规模的数据集(从 10 份文档到 100 万份以上)中高效搜索和阅读。它们已经能够在本地文件系统上展现出色的检索能力,但还需要一个合适的后端来管理大规模数据集合。检索工具集为各种需求提供了一系列多样的工具:

  1. 混合检索:将向量搜索与关键词搜索结合,让智能体通过设置 alpha 值在两者之间切换。
  2. 列出文件ls 的可扩展版本,用于列出索引中的文件。
  3. 文件 grep:支持在给定文件中进行正则表达式搜索。
  4. 文件读取:允许智能体从现有文档中读取一个子部分。

智能体可以任意组合使用这些工具来完成任务,从简单到复杂。

快来体验吧!

博客:https://llamaindex.ai/blog/announcing-retrieval-harness?utm_medium=socials&utm_source=twitter&utm_campaign=2026-jun-…

注册 LlamaParse:https://cloud.llamaindex.ai


LlamaParse 检索工具集:面向 AI 智能体的文件系统原语

来源:https://www.llamaindex.ai/blog/announcing-retrieval-harness?utm_medium=socials&utm_source=twitter&utm_campaign=2026-jun-

当我们作为开源项目启动 LlamaIndex 时,我们的重点是标准化 RAG 的核心原语:分块、嵌入、索引和检索。对于基础的问答工作负载,这一基础蓝图工作得完美无缺。

但企业级智能体已经完全超越了它。

传统的 RAG 将数据访问视为一个静态的、一次性的预处理步骤。它提取少量上下文片段,打包成一个提示窗口,然后盲目地期望最佳结果。自主智能体无法通过模糊的语义搜索栏来导航一个非结构化语料库。它们需要确定性的、系统级的工具来实时主动询问、验证和遍历文档。

今天,我们将扩展 LlamaParse Index,新增 检索工具集,提供文件系统原语用于文档遍历、视觉布局保留托管索引 以及 管道可观测性

纯语义搜索在答案跨越任意分块边界时会立刻陷入死胡同。此时,试图通过让智能体暴力逐文件爬取目录来恢复,会彻底摧毁你的令牌预算和延迟约束。

检索工具集通过将底层语料库暴露为一组文件系统风格的工具来解决这一问题,你的智能体可以原生调用这些工具:

  • 混合检索:一种高召回率的初次筛选,结合向量相似度搜索与关键词搜索,并内置重排序,瞬间缩小智能体的初始搜索空间。
  • 列出文件:文件发现。允许智能体显式列出索引中包含的文件,为它们提供可用文档结构的清晰地图。
  • 文件 grep:针对目标文件的服务器端正则表达式扫描。如果智能体需要隔离某个特定的序列号、错误代码或确切短语,它无需浪费令牌来加载不相关的语义分块。它直接对文件的解析文本执行正则查询。
  • 文件读取:克服分块碎片化。当 top-k 分块在句子中间截断上下文时,智能体调用直接读取 API 来拉取周围的文件上下文,无缝恢复缺失的数据。

视觉布局保留

对于仅靠文本提取不够的文档,我们现在在解析时捕获页面截图,并将其直接链接到源分块。

金融表格、监管表格和架构图等文档中,布局承载着结构意义,当它们被扁平化为原始文本字符串时,会丢失关键上下文。当检索到的文本不足以解决歧义时,智能体可以拉取 LlamaParse 处理后的实际渲染页面。这使智能体的推理直接扎根于源视觉布局,防止在密集表格或多列文档上产生幻觉。

托管基础设施

搭建生产级索引管道意味着在写一行应用代码之前就要做很多决策:数据源、嵌入模型、向量存储、同步逻辑、检索配置。而运行它则意味着要处理速率限制、API 故障以及难以诊断的管道中断。

LlamaParse Index 现在原生地、开箱即用地编排这一基础设施层。你只需连接文档,平台就会自动提供一个优化过的、生产级的基础基线——消除了手动设置的开销,让你能完全专注于你的应用程序。

  • 增量同步:我们跟踪哪些文件发生了变化,只处理这些文件。一个包含 1000 份文档的文件夹新增加了 50 个文件,下次同步时只会对 50 个文件运行管道。解析成本和延迟随实际文档活动而扩展,而不是文件夹大小。
  • 数据可移植性:如果你需要自带向量存储或嵌入模型,解析后的输出可以下载。

管道可观测性

生产级检索管道会以非显而易见的方式失败。一次同步完成,但本应进入索引的分块却没有。某个阶段显示绿色,但后续阶段却已静默停滞。等到检索质量下降时,故障已经离实际发生点好几步远了。

我们直接将原生的、逐阶段管道跟踪构建到了 LlamaParse Index 中。管道的每个阶段都有自己的状态和文件计数。当同步完成但索引中缺少文件时,阶段计数会显示它们在何处停止。你知道它是摄取故障还是工作流故障。你直接修复它,而不是重构发生了什么。

集成与可用性

检索工具集及其他更新现在在所有付费层中作为 beta 版本提供。所有文件系统工具都作为轻量级 API 协议暴露,可以直接集成到你现有的 LLM 编排框架或工具调用循环中。

👉 深入阅读文档 (https://developers.llamaindex.ai/llamaparse/cloud-index-v2/getting_started/) 查看 API 规范,或者直接从 LlamaIndex 仪表盘初始化你的第一个托管索引。

LlamaIndex 🦙 (@llama_index): 仅靠语义搜索是不够的。暴力 grep 也不行。 智能体两者都需要。

今天我们在 LlamaParse Index 中发布了检索工具集:语义搜索、服务器端 grep 和文件级导航在一个智能体推理循环中协同工作。🦙🌤️

Grep 一

相似文章