@tom_doerr: 将图像和PDF转换为Markdown,无需OCR https://github.com/NanoNets/docext

X AI KOLs Timeline 工具

摘要

docext是一个本地部署的工具包,无需OCR即可将图像和PDF转换为Markdown,利用视觉语言模型。它还引入了Nanonets-OCR-s,一个紧凑的3B参数模型,用于高效的图像到Markdown转换。

将图像和PDF转换为Markdown,无需OCR https://t.co/tI0EDdaWZR https://t.co/eFGzn4DLRa
查看原文
查看缓存全文

缓存时间: 2026/05/08 17:36

docext - 一个本地部署的文档信息提取与基准测试工具包。

相似文章