abiruyt/text-extract-ocr

Replicate Explore 模型

ocr text-extraction open-source replicate cpu

摘要

abiruyt/text-extract-ocr 是一个开源OCR模型，可在Replicate上使用，在CPU上运行，成本低且推理速度快。

abiruyt / text-extract-ocr

查看原文

查看缓存全文

缓存时间: 2026/05/17 00:19

# abiruyt/text-extract-ocr – Replicate 来源：https://replicate.com/abiruyt/text-extract-ocr ## 运行时间与成本该模型在 Replicate 上运行的成本约为 0.00010 美元，即每 1 美元可运行 10000 次，但具体费用取决于您的输入。它也是开源的，您可以通过 Docker（https://replicate.com/abiruyt/text-extract-ocr/api）在自己的电脑上运行。该模型运行在 CPU 硬件（https://replicate.com/docs/billing）上。预测通常在 1 秒内完成。

相似文章

在Papers with Code一站式寻找最佳开源OCR模型 [P]

Reddit r/MachineLearning

Papers with Code上的一个精选页面列出了顶级开源OCR模型和基准测试，重点介绍了百度（Unlimited OCR）和Mistral（OCR 4）的新发布，旨在支持RAG等AI智能体应用场景。

@vanstriendaniel: OCR模型又来了！百度公司的Unlimited-OCR是其中比较有趣的一个。你可以无需太多…

X AI KOLs Following

这篇文章展示了如何在Hugging Face Jobs上将百度的Unlimited-OCR模型作为临时的、兼容OpenAI的端点提供服务，支持多页文档解析，具有表格转HTML和公式转LaTeX提取等功能。

@_akhaliq: 百度刚刚发布了 Unlimited-OCR

X AI KOLs Following

百度发布了 Unlimited-OCR，这是一款无使用限制的光学字符识别服务。

@oliviscusAI: 您现在可以用一个 17 亿参数的模型解析任何文档，它就是 dots-ocr。一个处理文本、表格等的系统。

X AI KOLs Timeline

本文介绍了 dots-ocr，这是一个拥有 17 亿参数的模型，能够在超过 100 种语言中解析文档中的文本、表格、公式和图像，而无需单独的 OCR 处理流程。

allenai/olmocr

GitHub Trending (daily)

olmOCR 是 AI2 开发的一个开源工具包，可将 PDF、PNG 和 JPEG 文件转换为干净的 Markdown 文本，支持公式、表格和复杂布局。它包含一个基准测试套件和多个模型版本（截至 2025 年 10 月为 v0.4.0），性能和效率均有提升。

提交意见反馈