@berryxia: 兄弟们,肝出来了!并且全部免费开源了! 我把PP-OCRv6直接做成了本地工作台,在Mac上用CoreML加速,一键就能切换Tiny、Small、Medium三个模型大小! Tiny只有1.5MB适合极致轻量,Medium 34.5MB主…
摘要
作者将PP-OCRv6做成本地工作台并免费开源,支持Mac CoreML加速,提供Tiny/Small/Medium三种模型,支持图片上传、批量处理和多种导出格式,本地运行保护隐私。
查看缓存全文
缓存时间: 2026/06/17 07:50
兄弟们,肝出来了!并且全部免费开源了!
我把PP-OCRv6直接做成了本地工作台,在Mac上用CoreML加速,一键就能切换Tiny、Small、Medium三个模型大小!
Tiny只有1.5MB适合极致轻量,Medium 34.5MB主打精度,中间Small做平衡。
支持图片上传、批量处理、结果导出CSV/Markdown/Excel,历史记录自动保存。
整个东西完全本地跑,隐私安全,不用上传任何数据。
最爽的是在苹果硅上自动开启CoreML加速,Intel Mac和Linux也能CPU跑。
还专门做了浏览器版Tiny模型,零依赖直接在网页里就能用OCR。
附带评测脚本,能跟OmniDocBench和macOS自带Apple Vision对比,实际测试在弯曲表面、点阵字体、低对比度这些难搞场景表现都不错。
以前做本地OCR最烦的就是模型下载、环境配置、精度和速度权衡,现在我把这些全封装好了。
开发者、研究者、需要离线处理文档的人直接clone就能用。
这其实是我自己日常做OCR时踩了很多坑后,顺手做的东西。
希望能帮到同样有这个需求的朋友。
相似文章
@berryxia: https://x.com/berryxia/status/2067078380017828205
作者实测了PP-OCRv6三档模型并提供了本地部署的开源工具,展示了在OmniDocBench及真实场景下各模型的性能对比,强调轻量专用模型在OCR任务上的优势。
@rionaifantasy: 逆天了!34.5M 参数的 OCR,凭什么能赢过 235B 大模型? 说个离大谱的事,我以前一直以为 OCR 的未来一定会被越来越大的多模态大模型吃掉。 但看完百度文心这次发布的 PP-OCRv6,我有所改观了。 因为它走的不是“继续堆参…
百度文心发布 PP-OCRv6,提供 Tiny/Small/Medium 三档模型,支持 50 多种语言;其中 Tiny 版仅 1.5MB 可在浏览器本地运行,单图预测最快 97ms,证明小型专用模型可在 OCR 任务上超越大模型。
@TeksEdge: 需要OCR文档吗?PP-OCRv6已发布——目前你可以下载的最佳开源OCR模型 ◆︎ 完全开源…
PP-OCRv6是百度PaddleOCR新推出的开源OCR模型系列,提供Tiny/Small/Medium三种尺寸,精度和速度优秀,优于多个商业模型。
@AdinaYakup: 百度 @PaddlePaddle 发布 PP-OCRv6:tiny 1.5M / small 7.7M / medium 34.5M,支持 48+ 种语言,支持手写/……
百度 PaddlePaddle 发布了 PP-OCRv6,一款支持 48+ 种语言的 OCR 模型,提供 tiny(1.5M)、small(7.7M)和 medium(34.5M)三种尺寸,针对边缘部署进行了优化,可处理手写、印刷、工业、屏幕和卡片文字。
@NFTCPS: 兄弟们,又一个让我直呼离谱的开源神器出现了 有人把 PDF 解析器干到了每秒 100 页转 Markdown,关键是 100% 免费,纯 CPU 就能跑,不要 GPU、不要云端、连 API key 都省了。 它叫 OpenDataLoad…
开源 PDF 解析器 OpenDataLoader,每秒可转换 100 页为 Markdown,纯 CPU 运行,免费且开源,由 PDF 协会和 veraPDF 团队开发,在基准测试中排名第一。