lightweight-deployment

标签

Cards List
#lightweight-deployment

GRACE-RAG:规范证据合成的受控检索架构,支持在封闭领域机构环境中轻量化部署

arXiv cs.AI · 2天前 缓存

本文介绍了 GRACE-RAG,这是一种检索受控、图增强的 RAG 架构,它将结构推理从生成过程外化到结构化的检索层,从而能够在封闭领域的机构环境中实现轻量化部署。实验表明,在中规模模型上质量提升高达 20%,同时减少了计算和延迟开销。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈