pdf-parsing

标签

Cards List
#pdf-parsing

@jerryjliu0: 我们解析PDF。我们花了七位数在旧金山各地投放广告牌。我深思熟虑过是否要放些更具创意和趣味的内容。但那样你就不知道我们是做什么的了。

X AI KOLs Following · 2天前 缓存

LlamaIndex 的 Jerry Liu 宣布在旧金山投入超过100万美元的广告牌宣传活动,推广其用于AI代理的PDF解析服务,并列出即将在技术会议上参展的展位。

0 人收藏 0 人点赞
#pdf-parsing

@llama_index: 只需几行代码即可自动化贷款承销流程 一份典型的贷款文件是一叠工资单和…

X AI KOLs Following · 2026-05-26 缓存

LlamaIndex 展示了如何使用 LlamaParse 从金融 PDF 中提取结构化数据,实现贷款承销流程的自动化,包括跨文档分析和人工审核。

0 人收藏 0 人点赞
#pdf-parsing

@rwayne: 太屌了学术论文搭本地知识库,瓶颈一直在 PDF 怎么干净转 md。OpenDataLoader-PDF 把这道题做到了 0.907 准确率 开源 PDF 解析榜第一全套 Apache 2.0。 200 篇真实论文测试集的关键数字 总分 0…

X AI KOLs Timeline · 2026-05-10

OpenDataLoader-PDF 是一款开源 PDF 解析工具,在真实学术论文测试中达到 0.907 的高准确率,支持将复杂的 PDF 文档(含表格、公式、扫描件)高效转换为 Markdown 和 JSON,非常适合本地知识库和 RAG 应用。

0 人收藏 0 人点赞
#pdf-parsing

@AIExplorerTim: 有人刚刚开发了一个工具,可以将 PDF 转换为 干净、结构化的 Markdown 速度达到 100 页/秒 不需要 GPU。 不需要 API 成本。 没有混乱的解析。 只有原始的、可用的数据。 它可以轻松处理的内容: • 表格 → 完美提…

X AI KOLs Timeline · 2026-05-09 缓存

OpenDataLoader 是一个开源工具,可将 PDF 转换为结构化的 Markdown 和 JSON,支持 100 页/秒的本地处理速度,无需 GPU 或 API 成本,专为 RAG 管道和 PDF 无障碍自动化设计。

0 人收藏 0 人点赞
#pdf-parsing

@jerryjliu0: 使用VLM解析PDF的一个缺点是难以保证输出文本的*正确性*和正确的阅读顺序……

X AI KOLs Following · 2026-04-18 缓存

Jerry Liu讨论了使用视觉语言模型进行PDF解析所面临的挑战,特别是关于确保文本正确性和保持正确阅读顺序的同时避免出现幻觉问题。

0 人收藏 0 人点赞
#pdf-parsing

run-llama/liteparse

GitHub Trending (daily) · 6天前 缓存

LiteParse 是 run-llama 推出的一个独立的开源 PDF 解析工具,提供快速、本地的空间文本提取及边界框,支持多种编程语言和平台。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈