@ErickSky: 百度刚刚打破了当前OCR最大的限制之一。Unlimited-OCR一次性处理整个文档…

X AI KOLs Timeline 2026/06/23 02:24 模型

ocr baidu document-processing unlimited-ocr deep-learning

摘要

百度发布了Unlimited-OCR，它可以一次性处理整个文档而无需分块，克服了当前OCR技术的一个主要限制。

百度刚刚打破了当前OCR最大的限制之一。 Unlimited-OCR一次性处理整个文档，无需分块。这是DeepSeek-OCR之后的下一步。 REPOOO👇 https://t.co/onbAwQeYlw

查看原文

查看缓存全文

缓存时间: 2026/06/23 12:07

百度刚刚打破了当前 OCR 最大的限制之一。

Unlimited-OCR 可以一次性处理整个文档，无需分块。

这是 DeepSeek-OCR 之后的下一步。

仓库👇 https://t.co/onbAwQeYlw

相似文章

Hacker News Top

百度发布Unlimited-OCR，这是一个基于Deepseek-OCR构建的开源模型，用于一次性长程文档解析，支持单张图片、多页文档和PDF。

Hugging Face Models Trending

百度发布了Unlimited-OCR，一种用于一次性长程文档解析的新模型，基于Deepseek-OCR构建。它支持通过Hugging Face Transformers和SGLang进行单图像和多页/PDF解析。

X AI KOLs Timeline

百度开源了 Unlimited OCR 模型，采用参考滑动窗口注意力（R-SWA）机制，实现了对长达 32K 上下文的一次性文档解析，无需逐页推理。

Hugging Face Daily Papers

Unlimited OCR 引入了 Reference Sliding Window Attention，以消除长序列 OCR 任务中不断增长的内存消耗，从而能够在单次前向传播中高效转录多页文档。

X AI KOLs Following

PaddlePaddle发布了Unlimited-OCR，一种新的OCR模型，使用参考滑动窗口注意力（R-SWA）在解码过程中保持恒定的KV缓存，在OmniDocBench上达到了93%的准确率，相比之前的方法提升了6%。