@akshay_pachaar: - <1B参数 - 支持91种语言 - RTX 5090上每秒5页 - 可在CPU、GPU、MPS上运行 - 83.3% olmocr基准得分(3B以下最高)…

X AI KOLs Following 模型

摘要

Surya OCR是一款最先进的开源OCR模型,参数少于10亿(<1B),支持91种语言,在3B参数以下的基准测试中取得最高分。

- <1B参数 - 支持91种语言 - RTX 5090上每秒5页 - 可在CPU、GPU、MPS上运行 - 83.3% olmocr基准得分(3B以下最高) Surya OCR是一款最先进的文档智能模型。 100%开源。https://t.co/Sh2voqeUMf
查看原文
查看缓存全文

缓存时间: 2026/05/31 06:39

  • 小于10亿参数
  • 支持91种语言
  • 在RTX 5090上每秒5页
  • 支持CPU、GPU、MPS运行
  • 83.3% olmocr基准评分(3B以下最佳)

Surya OCR 是文档智能领域最先进的模型。

100%开源。https://t.co/Sh2voqeUMf

相似文章

使用合成数据构建快速多语言OCR模型

Hugging Face Blog

NVIDIA推出Nemotron OCR v2,一个使用合成数据生成技术构建的快速多语言OCR模型。该模型通过采用统一的基于FOTS的架构,在检测、识别和关系组件之间实现特征复用,在单个A100 GPU上达到34.7页/秒的性能。

abiruyt/text-extract-ocr

Replicate Explore

abiruyt/text-extract-ocr 是一个开源OCR模型,可在Replicate上使用,在CPU上运行,成本低且推理速度快。