@KyrieCheungYep: 我做了一个 Skill:ky-markdown-rebuilder 专门把 PDF、PPT、白皮书、方案书、课程资料、长截图这类“视觉文档”,重建成结构可靠的 Markdown,因为 AI 读这些源文件会比较差,Markdown 除了可以…
摘要
KyrieCheungYep 发布了一个名为 ky-markdown-rebuilder 的 Skill,专门将 PDF、PPT 等视觉文档重建成结构可靠的 Markdown,以提升 AI 对复杂文档的阅读理解能力。
查看缓存全文
缓存时间: 2026/07/03 14:38
我做了一个 Skill:ky-markdown-rebuilder
专门把 PDF、PPT、白皮书、方案书、课程资料、长截图这类“视觉文档”,重建成结构可靠的 Markdown,因为 AI 读这些源文件会比较差,Markdown 除了可以让 AI 更好地读文件,还能把这些源文件变成可利用可重新构建的资产
微软官方已经有 MarkItDown,但用过的都知道其实很不好用,它更适合做“格式转换”和“文字抽取”
普通 Word、网页、线性 PDF,用 MarkItDown 就够了。 一旦遇到 PPT、销售 deck、图表等等比较复杂的报告,问题会很多:
左右栏会混在一起、时间线会乱序、架构图会变成散字、表格、截图、注释容易挤成一团,AI 后面再读,就会把乱文本当真
ky-markdown-rebuilder 会先抽文本,再把原文件渲染成一页页截图,对照真实版面重新整理 Markdown
它可以做到:
1、按页还原 每一页单独成节,不把相邻页面揉在一起
2、按视觉关系整理 左右栏、卡片、流程图、时间线、对比矩阵、截图说明,会按原来的结构重建
3、适合复杂文档 PPT、PDF 报告、白皮书、课程资料、产品 deck、销售方案书、长截图都能处理
4、支持深度视觉模式 遇到信息密度高的页面,会专门检查布局、图表、模块关系,不只是抽几行文字
5、能继续生成大纲 如果需要 outline,会基于校准后的 Markdown 生成,而不是直接拿乱序文本总结
我用初中化学课本还有今天合作伙伴发的PPT,做出来放了一些效果示例图,看下面图片可以直观地看到效果
一份规整的 Markdown 文档,在使用过程中能够极高地提升效率
我把这个 Skill 放到 Github 了,需要的朋友可以试试!https://github.com/KyrieCheungYep/ky-markdown-rebuilder…
KyrieCheungYep/ky-markdown-rebuilder
Source: https://github.com/KyrieCheungYep/ky-markdown-rebuilder
KY Markdown Rebuilder
一个用于 Codex / Claude Code 的文档重建 Skill。
用途:把视觉结构复杂的 PDF、PPT、长截图、报告、方案 deck 等资料,重建成清晰、可靠、按页对齐的 Markdown。
可以尽量保留页面结构、表格、卡片、图示关系和视觉阅读顺序。
适合处理
- PPT / PPTX / slide deck
- PDF 报告、白皮书、课程资料
- 图文混排的方案文档
- 含表格、流程图、架构图、时间线、矩阵的资料
- 长截图或视觉密集页面
不适合简单纯文本文件。纯文本文件直接转换即可,不需要这个 Skill。
安装到 Codex
mkdir -p ~/.codex/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.codex/skills/ky-markdown-rebuilder
安装到 Claude Code
mkdir -p ~/.claude/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.claude/skills/ky-markdown-rebuilder
使用方式
在 Codex 或 Claude Code 中直接点名这个 Skill:
[$ky-markdown-rebuilder] 帮我把这个 PPTX 做成 Markdown
也可以自然语言触发:
把这个视觉比较复杂的 PDF 重建成按页对齐的 Markdown
默认输出
通常会生成:
source.calibrated.md
如果你要求大纲版、outline、两个文件,则会同时生成:
source.outline.md
输出特点
对于复杂文档,Markdown 会尽量按原页面重建:
- 每页或每张 slide 单独成节
- 保留页面标题和主要内容
- 表格尽量转成 Markdown 表格
- 卡片、分栏、流程、矩阵会按结构整理
- 对图片、截图、图表、架构关系做必要说明
- 避免把页面内容混成一大坨散乱文本
English
KY Markdown Rebuilder is a document reconstruction skill for Codex / Claude Code.
It converts visually complex PDFs, PPT decks, long screenshots, reports, and proposal documents into clean, reliable, page-aligned Markdown.
It is designed for documents where plain text extraction is not enough, especially when layout, tables, diagrams, cards, timelines, screenshots, or visual hierarchy matter.
Install for Codex
mkdir -p ~/.codex/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.codex/skills/ky-markdown-rebuilder
Install for Claude Code
mkdir -p ~/.claude/skills
git clone https://github.com/KyrieCheungYep/ky-markdown-rebuilder.git ~/.claude/skills/ky-markdown-rebuilder
Usage
[$ky-markdown-rebuilder] Convert this PPTX into Markdown
Typical output:
source.calibrated.md
If an outline is requested:
source.outline.md
相似文章
@Chenzeze777: 微软开源了一个 14 万星的文档神器,我整理了它最实用的 5 个场景。 MarkItDown,Python 工具,把 PDF/Word/PPT/Excel/HTML/图片,一键转成干净的 Markdown 文本。 你能用它做什么: · P…
微软开源了 MarkItDown,一个轻量级 Python 工具,可将 PDF、Word、PPT、Excel、HTML 和图片等文件一键转换为干净的结构化 Markdown 文本,方便用于 AI 摘要、数据分析、知识库构建等场景。
@KyrieCheungYep: 给大家介绍一下这个 Skill,这是我在向一些客户做项目介绍的时候,沉淀下来的 Skill,经过了我自己多番实战验证 这是一个专门把「可见 UI 参考图」高质量还原成 HTML/CSS 的 Codex&Claude Skill 它会把设计…
KyrieCheungYep 发布了一个名为 ky-design-to-html 的 Codex/Claude Skill,用于将 UI 截图或设计稿高质量还原为 HTML/CSS,通过拆解设计结构、分离代码与资产、画布适配及浏览器截图校验等工作流减少视觉偏差。
@KyrieCheungYep: 推荐一个 PPT 制作 Skill:ultimate-ppt-master-skill,它比较贴近真实工作时候需要做 PPT 的场景,功能和亮点如下: 1、先问清楚需求 很多 AI PPT 工具上来就做页,结果做出来全是空话。 PPT M…
推荐一个开源PPT制作工具ultimate-ppt-master-skill,它通过先明确需求、整理资料结构、生成可编辑PPTX或Web Deck、配图生成和成稿审阅等流程,贴近真实办公场景,解决AI PPT生成中常见的空话和不可编辑问题。
@QingQ77: 让 AI Agent 能够通过非破坏性文本编辑方式生成排版精美、信息密度高的中文 PPT https://github.com/GordenSun/GordenPPTSkill… 给 AI Agent 用的 PPT 构建技能,带了 17 …
一个让AI Agent通过非破坏性文本编辑生成精美中文PPT的开源项目,提供17个手工打磨的中文PPTX模板和完整的工具链。
@Jolyne_AI: 写技术文档时我们常用 Markdown,但一遇到复杂排版就力不从心。 我在 GitHub 上偶然发现一个开源工具:Quarkdown。你可以把它理解成“更强的 Markdown”——语法依旧轻量,却把排版、生成和自动化直接拉满。 GitH…
Quarkdown 是一个基于 Markdown 的增强版排版系统,支持变量和函数、多格式输出、实时预览等强大功能,适用于书籍、论文、演示文稿等场景,安装需 Java 17+。