@KaichaoYou:来自百度的一款出色的OCR模型!如果你看到OCR模型有多受欢迎,你会感到惊讶,它们有时甚至比顶尖的LLM还更受欢迎……

X AI KOLs Timeline 模型

摘要

百度的Unlimited-OCR模型采用了Reference Sliding Window Attention技术,现已获得vLLM支持,能够以恒定内存消耗高效地一次性解析整本书籍。

一款来自百度的出色OCR模型! 如果你看到OCR模型有多受欢迎,你会感到惊讶,它们有时甚至比顶尖的LLM还更受欢迎!😜
查看原文
查看缓存全文

缓存时间: 2026/06/29 02:22

一个来自百度的优秀OCR模型! 如果你看到OCR模型有多受欢迎,可能会大吃一惊——有时它们甚至比顶级LLM还要热门!😜

vLLM (@vllm_project): 🎉 百度(@Baidu_Inc)出品的Unlimited-OCR现已可在vLLM中运行。通过参考滑动窗口注意力(R-SWA),实现恒定KV缓存的整本书籍一次性解析。

🧠 R-SWA在整个解码过程中保持KV缓存固定——无论输出多长,都不会出现内存膨胀或速度下降。

相似文章

baidu/Unlimited-OCR

Hugging Face Models Trending

百度发布了Unlimited-OCR,一种用于一次性长程文档解析的新模型,基于Deepseek-OCR构建。它支持通过Hugging Face Transformers和SGLang进行单图像和多页/PDF解析。

Unlimited OCR: 一次性长程解析

Hacker News Top

百度发布Unlimited-OCR,这是一个基于Deepseek-OCR构建的开源模型,用于一次性长程文档解析,支持单张图片、多页文档和PDF。