标签
微软发布了MarkItDown,一个开源的Python库,可将任何文档转换为Markdown,以便与LLM配合使用。
微软推出MarkItDown工具,旨在将各种文档格式(如PDF、Word、Excel)转换为Markdown,以方便大模型和RAG系统处理企业数据。
微软开源了 MarkItDown,一个轻量级 Python 工具,可将 PDF、Word、PPT、Excel、HTML 和图片等文件一键转换为干净的结构化 Markdown 文本,方便用于 AI 摘要、数据分析、知识库构建等场景。
该工具允许用户将文档(docx、PPT、pdf、md)转换为HTML格式,并利用AI agent CLI进行编辑,支持多种输出格式,本地优先,开源。