abiruyt/text-extract-ocr
摘要
abiruyt/text-extract-ocr 是一个开源OCR模型,可在Replicate上使用,在CPU上运行,成本低且推理速度快。
abiruyt / text-extract-ocr
查看缓存全文
缓存时间: 2026/05/17 00:19
# abiruyt/text-extract-ocr – Replicate
来源:https://replicate.com/abiruyt/text-extract-ocr
## 运行时间与成本
该模型在 Replicate 上运行的成本约为 0.00010 美元,即每 1 美元可运行 10000 次,但具体费用取决于您的输入。它也是开源的,您可以通过 Docker(https://replicate.com/abiruyt/text-extract-ocr/api)在自己的电脑上运行。
该模型运行在 CPU 硬件(https://replicate.com/docs/billing)上。预测通常在 1 秒内完成。
相似文章
在Papers with Code一站式寻找最佳开源OCR模型 [P]
Papers with Code上的一个精选页面列出了顶级开源OCR模型和基准测试,重点介绍了百度(Unlimited OCR)和Mistral(OCR 4)的新发布,旨在支持RAG等AI智能体应用场景。
@vanstriendaniel: OCR模型又来了!百度公司的Unlimited-OCR是其中比较有趣的一个。你可以无需太多…
这篇文章展示了如何在Hugging Face Jobs上将百度的Unlimited-OCR模型作为临时的、兼容OpenAI的端点提供服务,支持多页文档解析,具有表格转HTML和公式转LaTeX提取等功能。
@_akhaliq: 百度刚刚发布了 Unlimited-OCR
百度发布了 Unlimited-OCR,这是一款无使用限制的光学字符识别服务。
@oliviscusAI: 您现在可以用一个 17 亿参数的模型解析任何文档,它就是 dots-ocr。一个处理文本、表格等的系统。
本文介绍了 dots-ocr,这是一个拥有 17 亿参数的模型,能够在超过 100 种语言中解析文档中的文本、表格、公式和图像,而无需单独的 OCR 处理流程。
allenai/olmocr
olmOCR 是 AI2 开发的一个开源工具包,可将 PDF、PNG 和 JPEG 文件转换为干净的 Markdown 文本,支持公式、表格和复杂布局。它包含一个基准测试套件和多个模型版本(截至 2025 年 10 月为 v0.4.0),性能和效率均有提升。