multimodal-rag

标签

Cards List
#multimodal-rag

MM-BizRAG:重新思考面向通用企业问答的多模态检索增强生成

arXiv cs.CL · 5天前 缓存

MM-BizRAG 是一个面向企业问答的多模态检索增强生成系统,通过文档结构感知分割和版式感知解析,在异构企业文档上的表现比以视觉为中心的基线方法最高提升 32%。该论文还提出了 FastRAGEval——一种基于 LLM 的高效评估指标,其与人类判断的对齐程度优于 RAGChecker,且成本更低。

0 人收藏 0 人点赞
#multimodal-rag

从场景到元素:可验证多模态RAG的多粒度证据检索

arXiv cs.CL · 2026-05-15 缓存

本文介绍了GranuVistaVQA,一个带有元素级注释的多模态基准,以及GranuRAG,一个将视觉元素视为可验证多模态RAG的一等检索单元的框架,相较于基线实现了高达29.2%的提升。

0 人收藏 0 人点赞
#multimodal-rag

面向AI教育中算法追踪与问题求解的检索增强型辅导

arXiv cs.AI · 2026-05-14 缓存

本文介绍了KITE,一个基于检索增强生成(RAG)的智能辅导系统,用于AI教育中的算法推理和问题求解。该系统采用意图感知的苏格拉底式回应策略和多模态RAG,提供基于课程内容、符合教学法的反馈,并通过指标评估、专家评审和模拟学生交互进行评价。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈