勿检索,需导航:将企业知识蒸馏为可导航的智能体技能,用于QA和RAG
摘要
Corpus2Skill (C2S) 是一种基于智能体的RAG系统,它用可导航的技能层级树替代传统的向量/BM25检索,让大语言模型在查询时可以直接浏览企业知识,无需嵌入模型或检索索引。
查看缓存全文
缓存时间: 2026/04/20 08:28
论文页面 - 不检索,而是导航:将企业知识提炼为可导航的Agent技能以用于QA和RAG
来源:https://huggingface.co/papers/2604.14572 我们构建并发布了Corpus2Skill (C2S),一个智能体式RAG系统,用可导航的技能层级替代传统的向量/BM25检索栈,LLM在查询时直接浏览该层级。在企业级QA基准测试上,C2S在服务时无需检索系统即可匹配或超越强检索基线。
C2S将任何语料库离线编译成Anthropic Skills树——每层有SKILL.md摘要,叶子节点有文档ID。查询时LLM遍历该树(通过代码执行ls/cat),并通过get_document工具拉取完整文档。无需向量数据库、BM25索引或嵌入模型在服务时。
相似文章
@omarsar0: // OpenClaw-Skill: 搜索智能体技能树 // 如果你为智能体构建可复用的技能库,这篇值得一看…
本文介绍了集体技能树搜索(CSTS)这一框架,它利用多个模型的集体智慧,为LLM智能体构建结构化、多样且可泛化的技能树。由此产生的模型OpenClaw-Skill在长程规划、工具使用和泛化能力方面展现了更优的智能体性能。
COLLEAGUE.SKILL:通过专家知识蒸馏实现自动化AI技能生成
本文介绍COLLEAGUE.SKILL,一个开源系统,能够从异构轨迹中自动提炼基于人的AI技能,形成可检查、可纠正、可移植的技能包,使LLM代理能够携带有限的人类专业知识和交互风格表征。
AgenticRAG:面向企业知识库的代理检索
本文介绍了 AgenticRAG,这是一个来自微软的框架,通过为大型语言模型(LLM)配备迭代搜索、文档导航和分析工具,增强了企业知识库的检索能力。它在多个基准测试中展示了相比标准 RAG 流水线在召回率和事实准确性方面的显著提升。
Skill-RAG:通过隐层状态探测和技能路由的故障感知检索增强
Skill-RAG 是一个故障感知的 RAG 框架,利用隐层状态探测和技能路由来诊断和纠正检索增强生成中的查询-证据不对齐问题。该方法检测检索失败并有选择性地应用目标技能(查询重写、问题分解、证据聚焦)以提高硬案例和分布外数据集的准确率。
@omarsar0: 这篇论文很好地结合了 Skills 与 RAG 的优势。大多数 RAG 系统会在每次查询时都进行检索,无论模型是否需要……
该研究提出了 Skill-RAG,一种将 Skills 与检索增强生成(RAG)相结合的新方法,以解决传统 RAG 系统无论模型是否确实需要信息都会在每次查询时进行检索所带来的低效问题。