@heynavtoor:曼哈顿的一位律师收到一份500页的合同。每一条款都必须可搜索。手动处理:一周。一位会计师…

X AI KOLs Timeline 工具

摘要

MinerU 是一款免费开源工具,可从 PDF 和扫描文档中提取文本、表格和公式,支持109种语言和批量处理,节省数小时的手动工作。

曼哈顿的一位律师收到一份500页的合同。每一条款都必须可搜索。手动处理:一周。 芝加哥的一位会计师收到200张扫描发票。每个数字都必须填入电子表格。手动处理:四天。 斯坦福的一位研究员有50篇学术论文。表格、公式、图表都锁在PDF里。手动处理:两周。 他们每个人都因复制粘贴而浪费了数天时间。 现在认识一下 MinerU。 一款免费开源工具,可读取任何PDF、Word文档、PowerPoint、Excel表格或扫描图像。它按阅读顺序提取文本。表格变成干净的HTML。方程变成LaTeX。可处理手写内容。支持109种语言。 你给它一份200页的PDF,90秒内就能得到干净的Markdown。 它与其它PDF工具有何不同: - 多栏布局。它在每栏内从上到下阅读,而不是从左到右跨越整个页面。像人类阅读一样。 - 扫描文档。内置OCR。指向一张1995年打印页面的照片,即可得到干净文本。 - 数学公式。LaTeX级别的识别。每个方程都能正确渲染。 - 表格。合并单元格、多行标题、跨三页的表格。全部保留。 - 万页文档。滑动窗口处理。无需手动拆分。 - 批处理模式。指向一个包含500个文档的文件夹,然后离开。 三种使用方式: - 命令行界面。每个文档一条命令。 - Python SDK。五行代码。 - 网页应用:http://mineru.net。上传、点击、下载。无需安装。 可接入 Claude Desktop、Cursor、Windsurf、LangChain、LlamaIndex、RAGFlow、Dify 和 FastGPT。将提取的文档直接输入你的 AI 代理。 故事: 上海人工智能实验室的 OpenDataLab 团队需要从数百万科学文档中提取干净文本以训练语言模型。现有工具都失败了。他们自己构建了一个,然后将其开源。 68,551 颗星。MinerU 开源许可证,基于 Apache 2.0。免费用于个人和商业用途。arXiv 上有三篇技术报告。 Adobe Acrobat Pro 每年收费 239.88 美元,但仍会丢失你的表格。 ABBYY FineReader Corporate 每年收费 165 美元,但仍无法处理公式。 Mistral OCR 每 1000 页收费 2 美元,你的账单永远不会停止。 MinerU 费用为 0。在你的笔记本上运行。你的文档永远不会离开你的机器。 这里是疯狂的部分。 那位律师在 4 分钟内取回了她的合同。每一条款都可搜索。 那位会计师输入了 200 张发票。每项数据在 12 分钟内落入电子表格。 那位研究员输入了他的 50 篇论文。他在一个周日下午写完了文献综述。 你的公司多年来手动处理的文档,MinerU 只需几分钟。 你的文档变成文本。你的文本变成数据。你的数据变成答案。 你曾经耗费在文书工作上的那一周又回到了你的手中。
查看原文
查看缓存全文

缓存时间: 2026/06/25 05:18

一位曼哈顿的律师收到一份500页的合同,每项条款都需要可搜索。手动处理:一周。

一位芝加哥的会计师收到200张扫描发票,每个数字都要填入电子表格。手动处理:四天。

一位斯坦福大学的研究人员有50篇学术论文,表格、公式、图表都锁在PDF里。手动处理:两周。

他们每个人都在浪费生命中的几天时间复制粘贴。

现在,来认识一下MinerU。

一个免费开源的工具,能读取任何PDF、Word文档、PowerPoint、Excel表格或扫描图像。它会按阅读顺序提取文本,表格变成干净的HTML,方程式变成LaTeX,手写内容也能处理,支持109种语言。

你给它一份200页的PDF,90秒内它就能还你一份干净的Markdown。

它与其他PDF工具的不同之处:

  • 多栏布局:它会从上到下阅读每一栏,而不是从左到右横跨整页——就像人类阅读一样。
  • 扫描文档:内置OCR,指向一张1995年打印页面的照片,就能返回干净文本。
  • 数学公式:LaTeX级别的识别,每个方程式都能正确渲染。
  • 表格:合并单元格、多行表头、跨三页的表格,全部保留。
  • 上万页的文档:滑动窗口处理,无需手动拆分。
  • 批量模式:指向一个包含500个文档的文件夹,然后离开。

三种使用方式:

  • CLI:每个文档一条命令。
  • Python SDK:五五行代码。
  • Web应用:访问 http://mineru.net,上传、点击、下载,无需安装。

可接入Claude Desktop、Cursor、Windsurf、LangChain、LlamaIndex、RAGFlow、Dify和FastGPT,将提取的文档直接喂给你的AI代理。

背后的故事:

上海人工智能实验室的OpenDataLab团队需要从数百万科学文档中提取干净文本来训练语言模型。现有工具都失败了。他们自己构建了一个,然后开源了它。

68,551颗星。MinerU开源许可证,基于Apache 2.0构建。个人和商业使用免费。arXiv上还有三篇技术报告。

Adobe Acrobat Pro 每年收费239.88美元,仍会丢失你的表格。 ABBYY FineReader Corporate 每年收费165美元,仍不能处理方程式。 Mistral OCR 每1,000页收费2美元,账单永不停歇。

MinerU 花费0美元。在你的笔记本电脑上运行。你的文档永远不离开你的机器。

最神奇的部分是:

那位律师在4分钟内拿回了她的合同,每项条款都可搜索。 那位会计师提交了200张发票,所有数字在12分钟内填入电子表格。 那位研究人员提交了50篇论文,他在一个周日下午就写完了文献综述。

你的公司多年来手工处理的文档,MinerU只需几分钟。

你的文档变成文本,你的文本变成数据,你的数据变成答案。

你曾经浪费在文书工作上的那一周,现在回到了你手中。


MinerU

来源:https://mineru.net/ 描述更多工具

Label LLM

Label U

MinerU Chem

MinerU Fans

Dingo

法律协议

用户服务协议

隐私政策

联系我们

https://github.com/opendatalab/MinerU

[email protected]

联系我们

联系我们

加入社群

加入社群

© 2025 MinerU。保留所有权利。粤ICP备2025363392号

描述法律协议

用户服务协议

隐私政策

联系我们

© 2025 MinerU。保留所有权利。粤ICP备2025363392号

相似文章

opendatalab/MinerU

GitHub Trending (daily)

MinerU 是 OpenDataLab 开发的一款开源工具,用于从 PDF 和文档中提取数据。

在 OpenAI 将合同转化为可搜索数据

OpenAI Blog

OpenAI 分享了如何构建内部合同数据智能体,自动从各种文档格式中提取和结构化合同数据,同时通过人工审核环节让财务专家保持控制权。该系统已将合同审核时间减少了一半,使团队能够每月处理数千份合同,而无需相应增加人员。