@berryxia: 兄弟们，肝出来了！并且全部免费开源了！我把PP-OCRv6直接做成了本地工作台，在Mac上用CoreML加速，一键就能切换Tiny、Small、Medium三个模型大小！ Tiny只有1.5MB适合极致轻量，Medium 34.5MB主…

X AI KOLs Timeline 2026/06/17 03:15 工具

ocr open-source coreml mac local-ocr privacy free

摘要

作者将PP-OCRv6做成本地工作台并免费开源，支持Mac CoreML加速，提供Tiny/Small/Medium三种模型，支持图片上传、批量处理和多种导出格式，本地运行保护隐私。

兄弟们，肝出来了！并且全部免费开源了！我把PP-OCRv6直接做成了本地工作台，在Mac上用CoreML加速，一键就能切换Tiny、Small、Medium三个模型大小！ Tiny只有1.5MB适合极致轻量，Medium 34.5MB主打精度，中间Small做平衡。支持图片上传、批量处理、结果导出CSV/Markdown/Excel，历史记录自动保存。整个东西完全本地跑，隐私安全，不用上传任何数据。最爽的是在苹果硅上自动开启CoreML加速，Intel Mac和Linux也能CPU跑。还专门做了浏览器版Tiny模型，零依赖直接在网页里就能用OCR。附带评测脚本，能跟OmniDocBench和macOS自带Apple Vision对比，实际测试在弯曲表面、点阵字体、低对比度这些难搞场景表现都不错。以前做本地OCR最烦的就是模型下载、环境配置、精度和速度权衡，现在我把这些全封装好了。开发者、研究者、需要离线处理文档的人直接clone就能用。这其实是我自己日常做OCR时踩了很多坑后，顺手做的东西。希望能帮到同样有这个需求的朋友。

查看原文

查看缓存全文

缓存时间: 2026/06/17 07:50

兄弟们，肝出来了！并且全部免费开源了！

我把PP-OCRv6直接做成了本地工作台，在Mac上用CoreML加速，一键就能切换Tiny、Small、Medium三个模型大小！

Tiny只有1.5MB适合极致轻量，Medium 34.5MB主打精度，中间Small做平衡。

支持图片上传、批量处理、结果导出CSV/Markdown/Excel，历史记录自动保存。

整个东西完全本地跑，隐私安全，不用上传任何数据。

最爽的是在苹果硅上自动开启CoreML加速，Intel Mac和Linux也能CPU跑。

还专门做了浏览器版Tiny模型，零依赖直接在网页里就能用OCR。

附带评测脚本，能跟OmniDocBench和macOS自带Apple Vision对比，实际测试在弯曲表面、点阵字体、低对比度这些难搞场景表现都不错。

以前做本地OCR最烦的就是模型下载、环境配置、精度和速度权衡，现在我把这些全封装好了。

开发者、研究者、需要离线处理文档的人直接clone就能用。

这其实是我自己日常做OCR时踩了很多坑后，顺手做的东西。

希望能帮到同样有这个需求的朋友。

相似文章

@berryxia: https://x.com/berryxia/status/2067078380017828205

X AI KOLs Timeline

作者实测了PP-OCRv6三档模型并提供了本地部署的开源工具，展示了在OmniDocBench及真实场景下各模型的性能对比，强调轻量专用模型在OCR任务上的优势。

@rionaifantasy: 逆天了！34.5M 参数的 OCR，凭什么能赢过 235B 大模型？说个离大谱的事，我以前一直以为 OCR 的未来一定会被越来越大的多模态大模型吃掉。但看完百度文心这次发布的 PP-OCRv6，我有所改观了。因为它走的不是“继续堆参…

X AI KOLs Timeline

百度文心发布 PP-OCRv6，提供 Tiny/Small/Medium 三档模型，支持 50 多种语言；其中 Tiny 版仅 1.5MB 可在浏览器本地运行，单图预测最快 97ms，证明小型专用模型可在 OCR 任务上超越大模型。

@TeksEdge: 需要OCR文档吗？PP-OCRv6已发布——目前你可以下载的最佳开源OCR模型 ◆︎ 完全开源…

X AI KOLs Timeline

PP-OCRv6是百度PaddleOCR新推出的开源OCR模型系列，提供Tiny/Small/Medium三种尺寸，精度和速度优秀，优于多个商业模型。

@AdinaYakup: 百度 @PaddlePaddle 发布 PP-OCRv6：tiny 1.5M / small 7.7M / medium 34.5M，支持 48+ 种语言，支持手写/……

X AI KOLs Following

百度 PaddlePaddle 发布了 PP-OCRv6，一款支持 48+ 种语言的 OCR 模型，提供 tiny（1.5M）、small（7.7M）和 medium（34.5M）三种尺寸，针对边缘部署进行了优化，可处理手写、印刷、工业、屏幕和卡片文字。

@NFTCPS: 兄弟们，又一个让我直呼离谱的开源神器出现了有人把 PDF 解析器干到了每秒 100 页转 Markdown，关键是 100% 免费，纯 CPU 就能跑，不要 GPU、不要云端、连 API key 都省了。它叫 OpenDataLoad…

X AI KOLs Timeline

开源 PDF 解析器 OpenDataLoader，每秒可转换 100 页为 Markdown，纯 CPU 运行，免费且开源，由 PDF 协会和 veraPDF 团队开发，在基准测试中排名第一。

相似文章

@berryxia: https://x.com/berryxia/status/2067078380017828205

@TeksEdge: 需要OCR文档吗？PP-OCRv6已发布——目前你可以下载的最佳开源OCR模型 ◆︎ 完全开源…

@AdinaYakup: 百度 @PaddlePaddle 发布 PP-OCRv6：tiny 1.5M / small 7.7M / medium 34.5M，支持 48+ 种语言，支持手写/……

@NFTCPS: 兄弟们，又一个让我直呼离谱的开源神器出现了 有人把 PDF 解析器干到了每秒 100 页转 Markdown，关键是 100% 免费，纯 CPU 就能跑，不要 GPU、不要云端、连 API key 都省了。 它叫 OpenDataLoad…

提交意见反馈

@NFTCPS: 兄弟们，又一个让我直呼离谱的开源神器出现了有人把 PDF 解析器干到了每秒 100 页转 Markdown，关键是 100% 免费，纯 CPU 就能跑，不要 GPU、不要云端、连 API key 都省了。它叫 OpenDataLoad…