layout-analysis

标签

Cards List
#layout-analysis

MM-BizRAG:重新思考面向通用企业问答的多模态检索增强生成

arXiv cs.CL · 2026-06-04 缓存

MM-BizRAG 是一个面向企业问答的多模态检索增强生成系统,通过文档结构感知分割和版式感知解析,在异构企业文档上的表现比以视觉为中心的基线方法最高提升 32%。该论文还提出了 FastRAGEval——一种基于 LLM 的高效评估指标,其与人类判断的对齐程度优于 RAGChecker,且成本更低。

0 人收藏 0 人点赞
#layout-analysis

MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型

Papers with Code Trending · 2025-09-26 缓存

MinerU2.5 是一个拥有 12 亿参数的视觉-语言模型,通过采用由粗到细的解析策略,在保持高计算效率的同时实现了最先进的文档解析准确率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈