@ErickSky: 百度刚刚打破了当前OCR最大的限制之一。Unlimited-OCR一次性处理整个文档…
摘要
百度发布了Unlimited-OCR,它可以一次性处理整个文档而无需分块,克服了当前OCR技术的一个主要限制。
百度刚刚打破了当前OCR最大的限制之一。
Unlimited-OCR一次性处理整个文档,无需分块。
这是DeepSeek-OCR之后的下一步。
REPOOO👇 https://t.co/onbAwQeYlw
查看缓存全文
缓存时间: 2026/06/23 12:07
百度刚刚打破了当前 OCR 最大的限制之一。
Unlimited-OCR 可以一次性处理整个文档,无需分块。
这是 DeepSeek-OCR 之后的下一步。
仓库👇 https://t.co/onbAwQeYlw
相似文章
Unlimited OCR: 一次性长程解析
百度发布Unlimited-OCR,这是一个基于Deepseek-OCR构建的开源模型,用于一次性长程文档解析,支持单张图片、多页文档和PDF。
baidu/Unlimited-OCR
百度发布了Unlimited-OCR,一种用于一次性长程文档解析的新模型,基于Deepseek-OCR构建。它支持通过Hugging Face Transformers和SGLang进行单图像和多页/PDF解析。
@GoSailGlobal: 现在的 OCR 处理几十页文档,是逐页跑的 每翻一页,记忆清零一次 百度今天悄悄在 GitHub 和 HuggingFace 开源了一个模型,叫 Unlimited OCR,它的灵感,来自人类抄书: - 你抄一本书,不会每写一个字就把前面…
百度开源了 Unlimited OCR 模型,采用参考滑动窗口注意力(R-SWA)机制,实现了对长达 32K 上下文的一次性文档解析,无需逐页推理。
Unlimited OCR 的工作原理
Unlimited OCR 引入了 Reference Sliding Window Attention,以消除长序列 OCR 任务中不断增长的内存消耗,从而能够在单次前向传播中高效转录多页文档。
@AdinaYakup: Unlimited-OCR——@PaddlePaddle的新OCR模型,能够单次处理数百页文档,同时保持速度稳定…
PaddlePaddle发布了Unlimited-OCR,一种新的OCR模型,使用参考滑动窗口注意力(R-SWA)在解码过程中保持恒定的KV缓存,在OmniDocBench上达到了93%的准确率,相比之前的方法提升了6%。