@thesupermanmx: 中国刚刚开源了一款OCR模型，可一次性转录整本书。它名为Unlimited OCR。构建于…

X AI KOLs Timeline 2026/06/27 12:11 模型

ocr open-source deepseek-ocr document-parsing memory-efficient ai-model

摘要

中国开源了Unlimited OCR，这是一款基于DeepSeek OCR的OCR模型，可以一次性转录整本书，内存使用恒定，在标准解析基准上达到93%的准确率。

中国刚刚开源了一款OCR模型，能一次性转录整本书。它叫做Unlimited OCR。基于DeepSeek OCR构建，并对注意力机制做了一个关键修复，因此无论文档多长，内存占用都保持稳定。 → 标准解析基准达到93%（比基线提高6%） → 40页以上的错误率低于0.11 → 每次可处理数十页 → 速度稳定，而旧模型速度会降低35% 100%开源。

查看原文

查看缓存全文

缓存时间: 2026/06/28 08:04

中国刚刚开源了一个OCR模型，可一次性转录整本书。

它叫Unlimited OCR。基于DeepSeek OCR构建，关键修复了注意力机制，无论文档多长，内存都保持稳定。

→ 标准解析基准测试达93%（较基线提升6%） → 40页以上的稿件错误率低于0.11 → 单次可处理数十页 → 速度稳定，旧模型则会减慢35%

100%开源。

相似文章

@GoSailGlobal: 现在的 OCR 处理几十页文档，是逐页跑的每翻一页，记忆清零一次百度今天悄悄在 GitHub 和 HuggingFace 开源了一个模型，叫 Unlimited OCR，它的灵感，来自人类抄书： - 你抄一本书，不会每写一个字就把前面…

X AI KOLs Timeline

百度开源了 Unlimited OCR 模型，采用参考滑动窗口注意力（R-SWA）机制，实现了对长达 32K 上下文的一次性文档解析，无需逐页推理。

@BaiduAI_News: 我们正在开源Unlimited OCR——专为一次性读取长文档而构建。总参数3B，仅500M激活…

X AI KOLs Timeline

百度开源Unlimited OCR，一个3B参数模型（500M激活参数），使用Reference Sliding Window Attention（R-SWA）一次性读取长文档，在OmniDocBench上取得最先进的SOTA结果。

Unlimited OCR: 一次性长程解析

Hacker News Top

百度发布Unlimited-OCR，这是一个基于Deepseek-OCR构建的开源模型，用于一次性长程文档解析，支持单张图片、多页文档和PDF。

@_akhaliq: 百度刚刚发布了 Unlimited-OCR

X AI KOLs Following

百度发布了 Unlimited-OCR，这是一款无使用限制的光学字符识别服务。

baidu/Unlimited-OCR

Hugging Face Models Trending

百度发布了Unlimited-OCR，一种用于一次性长程文档解析的新模型，基于Deepseek-OCR构建。它支持通过Hugging Face Transformers和SGLang进行单图像和多页/PDF解析。