abiruyt/text-extract-ocr
摘要
abiruyt/text-extract-ocr 是一个开源OCR模型,可在Replicate上使用,在CPU上运行,成本低且推理速度快。
abiruyt / text-extract-ocr
查看缓存全文
缓存时间: 2026/05/17 00:19
# abiruyt/text-extract-ocr – Replicate
来源:https://replicate.com/abiruyt/text-extract-ocr
## 运行时间与成本
该模型在 Replicate 上运行的成本约为 0.00010 美元,即每 1 美元可运行 10000 次,但具体费用取决于您的输入。它也是开源的,您可以通过 Docker(https://replicate.com/abiruyt/text-extract-ocr/api)在自己的电脑上运行。
该模型运行在 CPU 硬件(https://replicate.com/docs/billing)上。预测通常在 1 秒内完成。
相似文章
@oliviscusAI: 您现在可以用一个 17 亿参数的模型解析任何文档,它就是 dots-ocr。一个处理文本、表格等的系统。
本文介绍了 dots-ocr,这是一个拥有 17 亿参数的模型,能够在超过 100 种语言中解析文档中的文本、表格、公式和图像,而无需单独的 OCR 处理流程。
使用合成数据构建快速多语言OCR模型
NVIDIA推出Nemotron OCR v2,一个使用合成数据生成技术构建的快速多语言OCR模型。该模型通过采用统一的基于FOTS的架构,在检测、识别和关系组件之间实现特征复用,在单个A100 GPU上达到34.7页/秒的性能。
18 款 LLM OCR 实测(7k+ 次调用):便宜/旧模型常吊打旗舰,完整数据集+框架已开源 [R]
对 18 款大模型在 OCR 任务上的全面评测(7k+ 次调用)发现,便宜或旧模型往往能以极低成本达到与旗舰模型相当的准确率,数据集与评测框架已完全开源。
@techNmak:1.7B 参数轻量 VLM,在 OmniDocBench 上碾压巨头的 OCR 新王者
仅 1.7B 参数的多语言文档解析器 dots.ocr,用轻量体积实现 SOTA,证明文档理解无需巨无霸模型。
@aaron_epstein: 新发布的模型在OCR、视觉和STT任务上击败了sonnet 4.6、gemini 3 flash和gpt 5.4 mini @interfaze_ai
来自interfaze_ai的新AI模型声称在OCR、视觉和语音转文字任务上超越领先模型(sonnet 4.6、gemini 3 flash、gpt 5.4 mini)。