document-processing

标签

Cards List
#document-processing

@jerryjliu0:LiteParse,我们的开源文档解析器,在将复杂 PDF 布局、文本和表格解析为清晰的空间网格方面表现出色……

X AI KOLs Following · 2026-04-22 缓存

LiteParse 是一款基于启发式规则的开源 PDF 解析器,无需依赖 ML 模型即可快速将复杂布局、文本和表格转换为整洁的空间网格。

0 人收藏 0 人点赞
#document-processing

用于改进临床试验工作流程准确性和效率的AI辅助协议信息提取

arXiv cs.CL · 2026-04-20 缓存

Banting Health AI的研究人员展示了一个利用生成式大语言模型和检索增强生成(RAG)技术进行临床试验协议信息自动提取的AI系统,准确率达89%,相比独立LLM的62.6%有显著提升,AI辅助工作流程任务完成速度快40%,并降低认知负荷。

0 人收藏 0 人点赞
#document-processing

@jerryjliu0: 使用VLM解析PDF的一个缺点是难以保证输出文本的*正确性*和正确的阅读顺序……

X AI KOLs Following · 2026-04-18 缓存

Jerry Liu讨论了使用视觉语言模型进行PDF解析所面临的挑战,特别是关于确保文本正确性和保持正确阅读顺序的同时避免出现幻觉问题。

0 人收藏 0 人点赞
#document-processing

在 OpenAI 将合同转化为可搜索数据

OpenAI Blog · 2025-09-29 缓存

OpenAI 分享了如何构建内部合同数据智能体,自动从各种文档格式中提取和结构化合同数据,同时通过人工审核环节让财务专家保持控制权。该系统已将合同审核时间减少了一半,使团队能够每月处理数千份合同,而无需相应增加人员。

0 人收藏 0 人点赞
#document-processing

SmolDocling:一种超紧凑的端到端多模态文档转换视觉语言模型

Papers with Code Trending · 2025-03-14 缓存

SmolDocling 是一款紧凑型 2.56 亿参数视觉语言模型,专为端到端多模态文档转换设计。它引入了一种名为 DocTags 的新型通用标记格式,用于捕获带有位置信息的页面元素,其表现可与体积大 27 倍的模型相媲美。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈