标签
面向大学使用场景的本地文档处理工具(Docling、Liteparse、Mineru 和 Unstructured)对比,评估它们对本地部署的适用性。
推荐MinerU 3.1文档解析工具,能完美将PDF、Word、PPT等转换为Markdown,支持表格、公式、图片自动识别,并提供三种模式(Pipeline/VLM),开源且可商用。
MinerU 是 OpenDataLab 开发的一款开源工具,用于从 PDF 和文档中提取数据。