abiruyt/text-extract-ocr

Replicate Explore 模型

ocr text-extraction open-source replicate cpu

摘要

abiruyt/text-extract-ocr 是一个开源OCR模型，可在Replicate上使用，在CPU上运行，成本低且推理速度快。

abiruyt / text-extract-ocr

查看原文

查看缓存全文

缓存时间: 2026/05/17 00:19

# abiruyt/text-extract-ocr – Replicate 来源：https://replicate.com/abiruyt/text-extract-ocr ## 运行时间与成本该模型在 Replicate 上运行的成本约为 0.00010 美元，即每 1 美元可运行 10000 次，但具体费用取决于您的输入。它也是开源的，您可以通过 Docker（https://replicate.com/abiruyt/text-extract-ocr/api）在自己的电脑上运行。该模型运行在 CPU 硬件（https://replicate.com/docs/billing）上。预测通常在 1 秒内完成。

相似文章

@oliviscusAI: 您现在可以用一个 17 亿参数的模型解析任何文档，它就是 dots-ocr。一个处理文本、表格等的系统。

X AI KOLs Timeline

本文介绍了 dots-ocr，这是一个拥有 17 亿参数的模型，能够在超过 100 种语言中解析文档中的文本、表格、公式和图像，而无需单独的 OCR 处理流程。

使用合成数据构建快速多语言OCR模型

Hugging Face Blog

NVIDIA推出Nemotron OCR v2，一个使用合成数据生成技术构建的快速多语言OCR模型。该模型通过采用统一的基于FOTS的架构，在检测、识别和关系组件之间实现特征复用，在单个A100 GPU上达到34.7页/秒的性能。

18 款 LLM OCR 实测（7k+ 次调用）：便宜/旧模型常吊打旗舰，完整数据集+框架已开源 [R]

Reddit r/MachineLearning

对 18 款大模型在 OCR 任务上的全面评测（7k+ 次调用）发现，便宜或旧模型往往能以极低成本达到与旗舰模型相当的准确率，数据集与评测框架已完全开源。

@techNmak：1.7B 参数轻量 VLM，在 OmniDocBench 上碾压巨头的 OCR 新王者

X AI KOLs Timeline

仅 1.7B 参数的多语言文档解析器 dots.ocr，用轻量体积实现 SOTA，证明文档理解无需巨无霸模型。

@aaron_epstein: 新发布的模型在OCR、视觉和STT任务上击败了sonnet 4.6、gemini 3 flash和gpt 5.4 mini @interfaze_ai

X AI KOLs Following

来自interfaze_ai的新AI模型声称在OCR、视觉和语音转文字任务上超越领先模型（sonnet 4.6、gemini 3 flash、gpt 5.4 mini）。

提交意见反馈