@tom_doerr: 将图像和PDF转换为Markdown,无需OCR https://github.com/NanoNets/docext
摘要
docext是一个本地部署的工具包,无需OCR即可将图像和PDF转换为Markdown,利用视觉语言模型。它还引入了Nanonets-OCR-s,一个紧凑的3B参数模型,用于高效的图像到Markdown转换。
将图像和PDF转换为Markdown,无需OCR
https://t.co/tI0EDdaWZR https://t.co/eFGzn4DLRa
查看缓存全文
缓存时间: 2026/05/08 17:36
docext - 一个本地部署的文档信息提取与基准测试工具包。
相似文章
@AIExplorerTim: 有人刚刚开发了一个工具,可以将 PDF 转换为 干净、结构化的 Markdown 速度达到 100 页/秒 不需要 GPU。 不需要 API 成本。 没有混乱的解析。 只有原始的、可用的数据。 它可以轻松处理的内容: • 表格 → 完美提…
OpenDataLoader 是一个开源工具,可将 PDF 转换为结构化的 Markdown 和 JSON,支持 100 页/秒的本地处理速度,无需 GPU 或 API 成本,专为 RAG 管道和 PDF 无障碍自动化设计。
@techNmak:1.7B 参数轻量 VLM,在 OmniDocBench 上碾压巨头的 OCR 新王者
仅 1.7B 参数的多语言文档解析器 dots.ocr,用轻量体积实现 SOTA,证明文档理解无需巨无霸模型。
SmolDocling:一种超紧凑的端到端多模态文档转换视觉语言模型
SmolDocling 是一款紧凑型 2.56 亿参数视觉语言模型,专为端到端多模态文档转换设计。它引入了一种名为 DocTags 的新型通用标记格式,用于捕获带有位置信息的页面元素,其表现可与体积大 27 倍的模型相媲美。
@tom_doerr: 将项目转换为AI代理可导航的知识图谱 https://github.com/Muvon/octocode
Octocode将代码项目转换为AI代理(如Claude、Cursor和Windsurf)可导航的知识图谱,采用tree-sitter AST解析和MCP集成,实现语义搜索和依赖导航。
Markdown(Aaron Swartz 的网络日志)
Aaron Swartz 宣布发布 Markdown——他与 John Gruber 共同开发的轻量级文本转 HTML 工具,以及配套的 html2text 转换器。