@berryxia: 兄弟们,肝出来了!并且全部免费开源了! 我把PP-OCRv6直接做成了本地工作台,在Mac上用CoreML加速,一键就能切换Tiny、Small、Medium三个模型大小! Tiny只有1.5MB适合极致轻量,Medium 34.5MB主…

X AI KOLs Timeline 工具

摘要

作者将PP-OCRv6做成本地工作台并免费开源,支持Mac CoreML加速,提供Tiny/Small/Medium三种模型,支持图片上传、批量处理和多种导出格式,本地运行保护隐私。

兄弟们,肝出来了!并且全部免费开源了! 我把PP-OCRv6直接做成了本地工作台,在Mac上用CoreML加速,一键就能切换Tiny、Small、Medium三个模型大小! Tiny只有1.5MB适合极致轻量,Medium 34.5MB主打精度,中间Small做平衡。 支持图片上传、批量处理、结果导出CSV/Markdown/Excel,历史记录自动保存。 整个东西完全本地跑,隐私安全,不用上传任何数据。 最爽的是在苹果硅上自动开启CoreML加速,Intel Mac和Linux也能CPU跑。 还专门做了浏览器版Tiny模型,零依赖直接在网页里就能用OCR。 附带评测脚本,能跟OmniDocBench和macOS自带Apple Vision对比,实际测试在弯曲表面、点阵字体、低对比度这些难搞场景表现都不错。 以前做本地OCR最烦的就是模型下载、环境配置、精度和速度权衡,现在我把这些全封装好了。 开发者、研究者、需要离线处理文档的人直接clone就能用。 这其实是我自己日常做OCR时踩了很多坑后,顺手做的东西。 希望能帮到同样有这个需求的朋友。
查看原文
查看缓存全文

缓存时间: 2026/06/17 07:50

兄弟们,肝出来了!并且全部免费开源了!

我把PP-OCRv6直接做成了本地工作台,在Mac上用CoreML加速,一键就能切换Tiny、Small、Medium三个模型大小!

Tiny只有1.5MB适合极致轻量,Medium 34.5MB主打精度,中间Small做平衡。

支持图片上传、批量处理、结果导出CSV/Markdown/Excel,历史记录自动保存。

整个东西完全本地跑,隐私安全,不用上传任何数据。

最爽的是在苹果硅上自动开启CoreML加速,Intel Mac和Linux也能CPU跑。

还专门做了浏览器版Tiny模型,零依赖直接在网页里就能用OCR。

附带评测脚本,能跟OmniDocBench和macOS自带Apple Vision对比,实际测试在弯曲表面、点阵字体、低对比度这些难搞场景表现都不错。

以前做本地OCR最烦的就是模型下载、环境配置、精度和速度权衡,现在我把这些全封装好了。

开发者、研究者、需要离线处理文档的人直接clone就能用。

这其实是我自己日常做OCR时踩了很多坑后,顺手做的东西。

希望能帮到同样有这个需求的朋友。

相似文章

@rionaifantasy: 逆天了!34.5M 参数的 OCR,凭什么能赢过 235B 大模型? 说个离大谱的事,我以前一直以为 OCR 的未来一定会被越来越大的多模态大模型吃掉。 但看完百度文心这次发布的 PP-OCRv6,我有所改观了。 因为它走的不是“继续堆参…

X AI KOLs Timeline

百度文心发布 PP-OCRv6,提供 Tiny/Small/Medium 三档模型,支持 50 多种语言;其中 Tiny 版仅 1.5MB 可在浏览器本地运行,单图预测最快 97ms,证明小型专用模型可在 OCR 任务上超越大模型。