@TeksEdge: 需要OCR文档吗?PP-OCRv6已发布——目前你可以下载的最佳开源OCR模型 ◆︎ 完全开源…
摘要
PP-OCRv6是百度PaddleOCR新推出的开源OCR模型系列,提供Tiny/Small/Medium三种尺寸,精度和速度优秀,优于多个商业模型。
查看缓存全文
缓存时间: 2026/06/13 01:06
需要OCR文档?PP-OCRv6 已发布——目前可下载的最强开源OCR模型
◆︎ 完全开源(Apache 2.0) ◆︎ 出色的精度 + 速度 ◆︎ 提供 Tiny / Small / Medium 三种规模(最小仅1.5M参数) ◆︎ 对复杂文本、表格、多语言及工业文档表现强劲
超越: › Gemini 3.1 Pro › GPT-5.5 › Qwen3-VL-235B › Kimi-K2.6 › MiniMax-M3
PP-OCRv6 工作原理: 该模型基于 PaddlePaddle 深度学习框架(来自百度)构建。 您需要使用 PaddleOCR 工具包来运行。
PaddlePaddle(@PaddlePaddle): 🚀PP-OCRv6 正式发布!
🔥PaddleOCR 全新 OCR 模型系列参数规模从 1.5M 到 34.5M,带来了更强的精度、更快的推理速度以及更广的部署选择——从浏览器、边缘设备到服务器均可运行。
📊新特性: 🔸Tiny / Small / Medium 模型:
相似文章
@AdinaYakup: 百度 @PaddlePaddle 发布 PP-OCRv6:tiny 1.5M / small 7.7M / medium 34.5M,支持 48+ 种语言,支持手写/……
百度 PaddlePaddle 发布了 PP-OCRv6,一款支持 48+ 种语言的 OCR 模型,提供 tiny(1.5M)、small(7.7M)和 medium(34.5M)三种尺寸,针对边缘部署进行了优化,可处理手写、印刷、工业、屏幕和卡片文字。
🚀PP-OCRv6 正式发布!
PaddleOCR 发布 PP-OCRv6,全新的 OCR 模型系列,参数量从 1.5M 到 34.5M,提供更高的精度和更快的推理速度,支持 50 种语言以及 PCB、CAD 图纸等新场景,采用 Apache 2.0 开源许可证。
PaddleOCR 3.5:使用 Transformers 后端运行 OCR 与文档解析任务
PaddleOCR 3.5 新增了 Transformers 推理后端,使 PP-OCRv5 和 PaddleOCR-VL 1.5 等 OCR 及文档解析模型能够无缝运行于 Hugging Face 生态系统之中。
PaddleOCR-VL-1.6:通过欠优化区域精炼与渐进式后训练拓展文档解析前沿
PaddleOCR-VL-1.6 通过识别并精炼欠优化区域,结合针对性的数据优化与渐进式后训练,提升了文档解析性能,在 OmniDocBench v1.6 上达到 96.33% 的最新最优水平。
@DailyDoseOfDS_:在您自己的语言上微调DeepSeek-OCR!(100%本地)大多数视觉模型将文档视为巨大的序列…
DeepSeek-OCR是一个3B参数的视觉模型,使用上下文光学压缩进行高效的文档处理。使用Unsloth在波斯语文本上进行微调,字符错误率降低了88.26%,全部开源且可在单GPU上运行。