@AdinaYakup: Unlimited-OCR——@PaddlePaddle的新OCR模型，能够单次处理数百页文档，同时保持速度稳定…

X AI KOLs Following 2026/06/22 15:35 模型

ocr paddlepaddle r-swa document-parsing kv-cache omni-doc-bench

摘要

PaddlePaddle发布了Unlimited-OCR，一种新的OCR模型，使用参考滑动窗口注意力（R-SWA）在解码过程中保持恒定的KV缓存，在OmniDocBench上达到了93%的准确率，相比之前的方法提升了6%。

Unlimited-OCR 🔥@PaddlePaddle的新OCR模型它可以在单次处理中解析数百页，同时保持稳定的速度。关键思想是R-SWA（参考滑动窗口注意力），它在解码过程中保持KV缓存恒定。 🏆 在OmniDocBench上达到93% 📈 相比https://t.co/uuXPUhL22L提升6%

查看原文

查看缓存全文

缓存时间: 2026/06/22 17:38

Unlimited-OCR 🔥来自@PaddlePaddle的全新OCR

它可以单次解析数百页，同时保持稳定速度。

核心思路是R-SWA（参考滑动窗口注意力机制），该机制在解码过程中使KV缓存保持恒定。

🏆 在OmniDocBench上达到93%
📈 相比 https://t.co/uuXPUhL22L 提升+6%

@GoSailGlobal: 现在的 OCR 处理几十页文档，是逐页跑的每翻一页，记忆清零一次百度今天悄悄在 GitHub 和 HuggingFace 开源了一个模型，叫 Unlimited OCR，它的灵感，来自人类抄书： - 你抄一本书，不会每写一个字就把前面…

X AI KOLs Timeline

百度开源了 Unlimited OCR 模型，采用参考滑动窗口注意力（R-SWA）机制，实现了对长达 32K 上下文的一次性文档解析，无需逐页推理。

@AdinaYakup: Unlimited-OCR——@PaddlePaddle的新OCR模型，能够单次处理数百页文档，同时保持速度稳定…

相似文章

Unlimited OCR 的工作原理

PaddleOCR-VL-1.6：通过欠优化区域精炼与渐进式后训练拓展文档解析前沿

PaddlePaddle/PaddleOCR

@AdinaYakup: 百度 @PaddlePaddle 发布 PP-OCRv6：tiny 1.5M / small 7.7M / medium 34.5M，支持 48+ 种语言，支持手写/……

@GoSailGlobal: 现在的 OCR 处理几十页文档，是逐页跑的每翻一页，记忆清零一次百度今天悄悄在 GitHub 和 HuggingFace 开源了一个模型，叫 Unlimited OCR，它的灵感，来自人类抄书： - 你抄一本书，不会每写一个字就把前面…

提交意见反馈

相似文章

Unlimited OCR 的工作原理

PaddleOCR-VL-1.6：通过欠优化区域精炼与渐进式后训练拓展文档解析前沿

PaddlePaddle/PaddleOCR

@AdinaYakup: 百度 @PaddlePaddle 发布 PP-OCRv6：tiny 1.5M / small 7.7M / medium 34.5M，支持 48+ 种语言，支持手写/……

@GoSailGlobal: 现在的 OCR 处理几十页文档，是逐页跑的 每翻一页，记忆清零一次 百度今天悄悄在 GitHub 和 HuggingFace 开源了一个模型，叫 Unlimited OCR，它的灵感，来自人类抄书： - 你抄一本书，不会每写一个字就把前面…

提交意见反馈

@GoSailGlobal: 现在的 OCR 处理几十页文档，是逐页跑的每翻一页，记忆清零一次百度今天悄悄在 GitHub 和 HuggingFace 开源了一个模型，叫 Unlimited OCR，它的灵感，来自人类抄书： - 你抄一本书，不会每写一个字就把前面…