@heynavtoor:曼哈顿的一位律师收到一份500页的合同。每一条款都必须可搜索。手动处理:一周。一位会计师…
摘要
MinerU 是一款免费开源工具,可从 PDF 和扫描文档中提取文本、表格和公式,支持109种语言和批量处理,节省数小时的手动工作。
查看缓存全文
缓存时间: 2026/06/25 05:18
一位曼哈顿的律师收到一份500页的合同,每项条款都需要可搜索。手动处理:一周。
一位芝加哥的会计师收到200张扫描发票,每个数字都要填入电子表格。手动处理:四天。
一位斯坦福大学的研究人员有50篇学术论文,表格、公式、图表都锁在PDF里。手动处理:两周。
他们每个人都在浪费生命中的几天时间复制粘贴。
现在,来认识一下MinerU。
一个免费开源的工具,能读取任何PDF、Word文档、PowerPoint、Excel表格或扫描图像。它会按阅读顺序提取文本,表格变成干净的HTML,方程式变成LaTeX,手写内容也能处理,支持109种语言。
你给它一份200页的PDF,90秒内它就能还你一份干净的Markdown。
它与其他PDF工具的不同之处:
- 多栏布局:它会从上到下阅读每一栏,而不是从左到右横跨整页——就像人类阅读一样。
- 扫描文档:内置OCR,指向一张1995年打印页面的照片,就能返回干净文本。
- 数学公式:LaTeX级别的识别,每个方程式都能正确渲染。
- 表格:合并单元格、多行表头、跨三页的表格,全部保留。
- 上万页的文档:滑动窗口处理,无需手动拆分。
- 批量模式:指向一个包含500个文档的文件夹,然后离开。
三种使用方式:
- CLI:每个文档一条命令。
- Python SDK:五五行代码。
- Web应用:访问 http://mineru.net,上传、点击、下载,无需安装。
可接入Claude Desktop、Cursor、Windsurf、LangChain、LlamaIndex、RAGFlow、Dify和FastGPT,将提取的文档直接喂给你的AI代理。
背后的故事:
上海人工智能实验室的OpenDataLab团队需要从数百万科学文档中提取干净文本来训练语言模型。现有工具都失败了。他们自己构建了一个,然后开源了它。
68,551颗星。MinerU开源许可证,基于Apache 2.0构建。个人和商业使用免费。arXiv上还有三篇技术报告。
Adobe Acrobat Pro 每年收费239.88美元,仍会丢失你的表格。 ABBYY FineReader Corporate 每年收费165美元,仍不能处理方程式。 Mistral OCR 每1,000页收费2美元,账单永不停歇。
MinerU 花费0美元。在你的笔记本电脑上运行。你的文档永远不离开你的机器。
最神奇的部分是:
那位律师在4分钟内拿回了她的合同,每项条款都可搜索。 那位会计师提交了200张发票,所有数字在12分钟内填入电子表格。 那位研究人员提交了50篇论文,他在一个周日下午就写完了文献综述。
你的公司多年来手工处理的文档,MinerU只需几分钟。
你的文档变成文本,你的文本变成数据,你的数据变成答案。
你曾经浪费在文书工作上的那一周,现在回到了你手中。
MinerU
来源:https://mineru.net/ 描述更多工具
Label LLM
Label U
MinerU Chem
MinerU Fans
Dingo
法律协议
用户服务协议
隐私政策
联系我们
https://github.com/opendatalab/MinerU
联系我们
联系我们
加入社群
加入社群
© 2025 MinerU。保留所有权利。粤ICP备2025363392号
描述法律协议
用户服务协议
隐私政策
联系我们
© 2025 MinerU。保留所有权利。粤ICP备2025363392号
相似文章
opendatalab/MinerU
MinerU 是 OpenDataLab 开发的一款开源工具,用于从 PDF 和文档中提取数据。
@VincentLogic: 做 RAG 最头疼的是什么? 不是AI大模型,是文档解析啊! PDF、Word、PPT 转 Markdown 转得乱七八糟,表格公式全乱套... 最近试了下 MinerU 3.1,真香了! 一键转换,格式保留完美 表格、公式、图片自动识别…
推荐MinerU 3.1文档解析工具,能完美将PDF、Word、PPT等转换为Markdown,支持表格、公式、图片自动识别,并提供三种模式(Pipeline/VLM),开源且可商用。
@BlockInsight214: 论文、合同、扫描件丢给 AI 之前,最难的一步往往是「先把 PDF 洗干净」。这几个开源项目专干这件事:转成 Markdown/JSON,直接喂给 RAG 或 agent。 ① MarkItDown · 微软出品,Office/PDF/图…
介绍了五个开源工具(MarkItDown、MinerU、Docling、marker、surya),用于将PDF、Office文档等转换为Markdown或JSON,以便直接供RAG或AI代理使用。
在 OpenAI 将合同转化为可搜索数据
OpenAI 分享了如何构建内部合同数据智能体,自动从各种文档格式中提取和结构化合同数据,同时通过人工审核环节让财务专家保持控制权。该系统已将合同审核时间减少了一半,使团队能够每月处理数千份合同,而无需相应增加人员。
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型
MinerU2.5 是一个拥有 12 亿参数的视觉-语言模型,通过采用由粗到细的解析策略,在保持高计算效率的同时实现了最先进的文档解析准确率。