Unlimited OCR: 一次性长程解析

Hacker News Top 2026/06/23 11:35 模型

ocr parsing deep-learning baidu open-source computer-vision one-shot

摘要

百度发布Unlimited-OCR，这是一个基于Deepseek-OCR构建的开源模型，用于一次性长程文档解析，支持单张图片、多页文档和PDF。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/23 13:43

无限OCR工作

欢迎进入一次性长视野解析时代。

相似文章

Hugging Face Models Trending

百度发布了Unlimited-OCR，一种用于一次性长程文档解析的新模型，基于Deepseek-OCR构建。它支持通过Hugging Face Transformers和SGLang进行单图像和多页/PDF解析。

X AI KOLs Timeline

百度发布了Unlimited-OCR，它可以一次性处理整个文档而无需分块，克服了当前OCR技术的一个主要限制。

X AI KOLs Timeline

百度开源了视觉语言模型Unlimited-OCR，基于DeepSeek-OCR升级，支持一次性解析超长文档，提供gundam（单图密集文字）和base（多页/PDF）两种推理模式。

X AI KOLs Following

这篇文章展示了如何在Hugging Face Jobs上将百度的Unlimited-OCR模型作为临时的、兼容OpenAI的端点提供服务，支持多页文档解析，具有表格转HTML和公式转LaTeX提取等功能。

X AI KOLs Timeline

百度开源了 Unlimited OCR 模型，采用参考滑动窗口注意力（R-SWA）机制，实现了对长达 32K 上下文的一次性文档解析，无需逐页推理。