@KyrieCheungYep: 我做了一个 Skill:ky-markdown-rebuilder 专门把 PDF、PPT、白皮书、方案书、课程资料、长截图这类“视觉文档”,重建成结构可靠的 Markdown,因为 AI 读这些源文件会比较差,Markdown 除了可以…

X AI KOLs Timeline 工具

摘要

KyrieCheungYep 发布了一个名为 ky-markdown-rebuilder 的 Skill,专门将 PDF、PPT 等视觉文档重建成结构可靠的 Markdown,以提升 AI 对复杂文档的阅读理解能力。

我做了一个 Skill:ky-markdown-rebuilder 专门把 PDF、PPT、白皮书、方案书、课程资料、长截图这类“视觉文档”,重建成结构可靠的 Markdown,因为 AI 读这些源文件会比较差,Markdown 除了可以让 AI 更好地读文件,还能把这些源文件变成可利用可重新构建的资产 微软官方已经有 MarkItDown,但用过的都知道其实很不好用,它更适合做“格式转换”和“文字抽取” 普通 Word、网页、线性 PDF,用 MarkItDown 就够了。 一旦遇到 PPT、销售 deck、图表等等比较复杂的报告,问题会很多: 左右栏会混在一起、时间线会乱序、架构图会变成散字、表格、截图、注释容易挤成一团,AI 后面再读,就会把乱文本当真 ky-markdown-rebuilder 会先抽文本,再把原文件渲染成一页页截图,对照真实版面重新整理 Markdown 它可以做到: 1、按页还原 每一页单独成节,不把相邻页面揉在一起 2、按视觉关系整理 左右栏、卡片、流程图、时间线、对比矩阵、截图说明,会按原来的结构重建 3、适合复杂文档 PPT、PDF 报告、白皮书、课程资料、产品 deck、销售方案书、长截图都能处理 4、支持深度视觉模式 遇到信息密度高的页面,会专门检查布局、图表、模块关系,不只是抽几行文字 5、能继续生成大纲 如果需要 outline,会基于校准后的 Markdown 生成,而不是直接拿乱序文本总结 我用初中化学课本还有今天合作伙伴发的PPT,做出来放了一些效果示例图,看下面图片可以直观地看到效果 一份规整的 Markdown 文档,在使用过程中能够极高地提升效率 我把这个 Skill 放到 Github 了,需要的朋友可以试试!https://github.com/KyrieCheungYep/ky-markdown-rebuilder…
查看原文
查看缓存全文

缓存时间: 2026/07/03 14:38

我做了一个 Skill:ky-markdown-rebuilder

专门把 PDF、PPT、白皮书、方案书、课程资料、长截图这类“视觉文档”,重建成结构可靠的 Markdown,因为 AI 读这些源文件会比较差,Markdown 除了可以让 AI 更好地读文件,还能把这些源文件变成可利用可重新构建的资产

微软官方已经有 MarkItDown,但用过的都知道其实很不好用,它更适合做“格式转换”和“文字抽取”

普通 Word、网页、线性 PDF,用 MarkItDown 就够了。 一旦遇到 PPT、销售 deck、图表等等比较复杂的报告,问题会很多:

左右栏会混在一起、时间线会乱序、架构图会变成散字、表格、截图、注释容易挤成一团,AI 后面再读,就会把乱文本当真

ky-markdown-rebuilder 会先抽文本,再把原文件渲染成一页页截图,对照真实版面重新整理 Markdown

它可以做到:

1、按页还原 每一页单独成节,不把相邻页面揉在一起

2、按视觉关系整理 左右栏、卡片、流程图、时间线、对比矩阵、截图说明,会按原来的结构重建

3、适合复杂文档 PPT、PDF 报告、白皮书、课程资料、产品 deck、销售方案书、长截图都能处理

4、支持深度视觉模式 遇到信息密度高的页面,会专门检查布局、图表、模块关系,不只是抽几行文字

5、能继续生成大纲 如果需要 outline,会基于校准后的 Markdown 生成,而不是直接拿乱序文本总结

我用初中化学课本还有今天合作伙伴发的PPT,做出来放了一些效果示例图,看下面图片可以直观地看到效果

一份规整的 Markdown 文档,在使用过程中能够极高地提升效率

我把这个 Skill 放到 Github 了,需要的朋友可以试试!https://github.com/KyrieCheungYep/ky-markdown-rebuilder…


KyrieCheungYep/ky-markdown-rebuilder

Source: https://github.com/KyrieCheungYep/ky-markdown-rebuilder

KY Markdown Rebuilder

一个用于 Codex / Claude Code 的文档重建 Skill。

用途:把视觉结构复杂的 PDF、PPT、长截图、报告、方案 deck 等资料,重建成清晰、可靠、按页对齐的 Markdown。

可以尽量保留页面结构、表格、卡片、图示关系和视觉阅读顺序。


适合处理

  • PPT / PPTX / slide deck
  • PDF 报告、白皮书、课程资料
  • 图文混排的方案文档
  • 含表格、流程图、架构图、时间线、矩阵的资料
  • 长截图或视觉密集页面

不适合简单纯文本文件。纯文本文件直接转换即可,不需要这个 Skill。


安装到 Codex

mkdir -p ~/.codex/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.codex/skills/ky-markdown-rebuilder

安装到 Claude Code

mkdir -p ~/.claude/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.claude/skills/ky-markdown-rebuilder

使用方式

在 Codex 或 Claude Code 中直接点名这个 Skill:

[$ky-markdown-rebuilder] 帮我把这个 PPTX 做成 Markdown

也可以自然语言触发:

把这个视觉比较复杂的 PDF 重建成按页对齐的 Markdown

默认输出

通常会生成:

source.calibrated.md

如果你要求大纲版、outline、两个文件,则会同时生成:

source.outline.md

输出特点

对于复杂文档,Markdown 会尽量按原页面重建:

  • 每页或每张 slide 单独成节
  • 保留页面标题和主要内容
  • 表格尽量转成 Markdown 表格
  • 卡片、分栏、流程、矩阵会按结构整理
  • 对图片、截图、图表、架构关系做必要说明
  • 避免把页面内容混成一大坨散乱文本

English

KY Markdown Rebuilder is a document reconstruction skill for Codex / Claude Code.

It converts visually complex PDFs, PPT decks, long screenshots, reports, and proposal documents into clean, reliable, page-aligned Markdown.

It is designed for documents where plain text extraction is not enough, especially when layout, tables, diagrams, cards, timelines, screenshots, or visual hierarchy matter.

Install for Codex

mkdir -p ~/.codex/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.codex/skills/ky-markdown-rebuilder

Install for Claude Code

mkdir -p ~/.claude/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.claude/skills/ky-markdown-rebuilder

Usage

[$ky-markdown-rebuilder] Convert this PPTX into Markdown

Typical output:

source.calibrated.md

If an outline is requested:

source.outline.md

相似文章

@Chenzeze777: 微软开源了一个 14 万星的文档神器,我整理了它最实用的 5 个场景。 MarkItDown,Python 工具,把 PDF/Word/PPT/Excel/HTML/图片,一键转成干净的 Markdown 文本。 你能用它做什么: · P…

X AI KOLs Timeline

微软开源了 MarkItDown,一个轻量级 Python 工具,可将 PDF、Word、PPT、Excel、HTML 和图片等文件一键转换为干净的结构化 Markdown 文本,方便用于 AI 摘要、数据分析、知识库构建等场景。

@KyrieCheungYep: 给大家介绍一下这个 Skill,这是我在向一些客户做项目介绍的时候,沉淀下来的 Skill,经过了我自己多番实战验证 这是一个专门把「可见 UI 参考图」高质量还原成 HTML/CSS 的 Codex&Claude Skill 它会把设计…

X AI KOLs Timeline

KyrieCheungYep 发布了一个名为 ky-design-to-html 的 Codex/Claude Skill,用于将 UI 截图或设计稿高质量还原为 HTML/CSS,通过拆解设计结构、分离代码与资产、画布适配及浏览器截图校验等工作流减少视觉偏差。

@KyrieCheungYep: 推荐一个 PPT 制作 Skill:ultimate-ppt-master-skill,它比较贴近真实工作时候需要做 PPT 的场景,功能和亮点如下: 1、先问清楚需求 很多 AI PPT 工具上来就做页,结果做出来全是空话。 PPT M…

X AI KOLs Timeline

推荐一个开源PPT制作工具ultimate-ppt-master-skill,它通过先明确需求、整理资料结构、生成可编辑PPTX或Web Deck、配图生成和成稿审阅等流程,贴近真实办公场景,解决AI PPT生成中常见的空话和不可编辑问题。

@Jolyne_AI: 写技术文档时我们常用 Markdown,但一遇到复杂排版就力不从心。 我在 GitHub 上偶然发现一个开源工具:Quarkdown。你可以把它理解成“更强的 Markdown”——语法依旧轻量,却把排版、生成和自动化直接拉满。 GitH…

X AI KOLs Timeline

Quarkdown 是一个基于 Markdown 的增强版排版系统,支持变量和函数、多格式输出、实时预览等强大功能,适用于书籍、论文、演示文稿等场景,安装需 Java 17+。