@thesupermanmx: 中国刚刚开源了一款OCR模型,可一次性转录整本书。它名为Unlimited OCR。构建于…
摘要
中国开源了Unlimited OCR,这是一款基于DeepSeek OCR的OCR模型,可以一次性转录整本书,内存使用恒定,在标准解析基准上达到93%的准确率。
中国刚刚开源了一款OCR模型,能一次性转录整本书。
它叫做Unlimited OCR。基于DeepSeek OCR构建,并对注意力机制做了一个关键修复,因此无论文档多长,内存占用都保持稳定。
→ 标准解析基准达到93%(比基线提高6%)
→ 40页以上的错误率低于0.11
→ 每次可处理数十页
→ 速度稳定,而旧模型速度会降低35%
100%开源。
查看缓存全文
缓存时间: 2026/06/28 08:04
中国刚刚开源了一个OCR模型,可一次性转录整本书。
它叫Unlimited OCR。基于DeepSeek OCR构建,关键修复了注意力机制,无论文档多长,内存都保持稳定。
→ 标准解析基准测试达93%(较基线提升6%) → 40页以上的稿件错误率低于0.11 → 单次可处理数十页 → 速度稳定,旧模型则会减慢35%
100%开源。
相似文章
@GoSailGlobal: 现在的 OCR 处理几十页文档,是逐页跑的 每翻一页,记忆清零一次 百度今天悄悄在 GitHub 和 HuggingFace 开源了一个模型,叫 Unlimited OCR,它的灵感,来自人类抄书: - 你抄一本书,不会每写一个字就把前面…
百度开源了 Unlimited OCR 模型,采用参考滑动窗口注意力(R-SWA)机制,实现了对长达 32K 上下文的一次性文档解析,无需逐页推理。
@BaiduAI_News: 我们正在开源Unlimited OCR——专为一次性读取长文档而构建。总参数3B,仅500M激活…
百度开源Unlimited OCR,一个3B参数模型(500M激活参数),使用Reference Sliding Window Attention(R-SWA)一次性读取长文档,在OmniDocBench上取得最先进的SOTA结果。
Unlimited OCR: 一次性长程解析
百度发布Unlimited-OCR,这是一个基于Deepseek-OCR构建的开源模型,用于一次性长程文档解析,支持单张图片、多页文档和PDF。
@_akhaliq: 百度刚刚发布了 Unlimited-OCR
百度发布了 Unlimited-OCR,这是一款无使用限制的光学字符识别服务。
baidu/Unlimited-OCR
百度发布了Unlimited-OCR,一种用于一次性长程文档解析的新模型,基于Deepseek-OCR构建。它支持通过Hugging Face Transformers和SGLang进行单图像和多页/PDF解析。