pdf

#pdf

@grgerwcwetwet: 中国家长建议收藏这个 GitHub 项目：ChinaTextbook 有人把国内从小学到大学的教材整理成了 PDF，直接开源免费下载，找课本、预习复习、给孩子补资料都很方便。覆盖内容很全：小学：1-6 年级全科教材，含五四学制版本初…

X AI KOLs Timeline ↗ · 19小时前缓存

ChinaTextbook 是一个 GitHub 开源项目，整理了从小学到大学的教材 PDF，供免费下载，方便家长和学生获取电子课本。

0 人收藏 0 人点赞

#pdf

@mdancho84：这份277页的PDF揭示了大型语言模型的秘密。以下是内容概述：

X AI KOLs Timeline ↗ · 20小时前缓存

一份277页的PDF指南，揭示大型语言模型的深刻见解，由Matt Dancho通过推特讨论串分享。

0 人收藏 0 人点赞

#pdf

@ericzakariasson: Slack 中的 Cursor 现在可以读取线程中附加的文档，包括 .txt、.log、.json、.zip、.pdf 或 .docx 文件！

X AI KOLs Following ↗ · 3天前缓存

Cursor 现在可以读取 Slack 线程中附加的文档，支持 .txt、.log、.json、.zip、.pdf 和 .docx 等格式。

0 人收藏 0 人点赞

#pdf

@NFTCPS: 书虫们注意了！你家那堆买来吃灰的技术书，终于有救了。 GitHub上一个叫book-to-skill的开源神器刚火，狂揽2700多Star，玩法是真离谱： PDF或EPUB直接丢进去自动扒目录、核心概念和套路，一键生成技能以后敲一句 …

X AI KOLs Timeline ↗ · 4天前缓存

GitHub上开源的 book-to-skill 工具可将 PDF/EPUB 技术书转化为 Claude Code 技能，一键生成目录、核心概念和模式，让吃灰的书变身为随叫随到的私人顾问。

0 人收藏 0 人点赞

#pdf

工作流中的PDF正在消耗约3倍token，使用微软的Markitdown免费节省

Reddit r/AI_Agents ↗ · 5天前

微软的Markitdown工具将PDF转换为markdown，在向Claude等AI模型提供文档时可节省token和成本，但在处理扫描PDF、图表和复杂表格时需要谨慎。

0 人收藏 0 人点赞

#pdf

@kushalbyatnal: 每天创建的PDF文件超过10亿份，但你的智能体仍然无法可靠地读取它们。今天，我们发布了Parse…

X AI KOLs Following ↗ · 2026-05-26 缓存

Extend 发布了 Parse 2.0，这是一款最先进的文档解析 API，在真实文档上实现了顶尖的准确率，并在开源基准测试 RealDoc-Bench 上超越了竞争对手。

0 人收藏 0 人点赞

#pdf

@leopardracer：此人15分钟读完一本134页的书，一次都没高亮，但全记住了。他把PDF扔进去……

X AI KOLs Timeline ↗ · 2026-05-24 缓存

有用户描述某人利用AI工具在15分钟内读了一本134页的书，自动生成原子笔记和闪卡，无需高亮，凸显了使用合适基础设施带来的效率差距。

0 人收藏 0 人点赞

#pdf

@wsl8297: 想把电子书或文档做成有声书？很多工具不是声音太“机器人”，就是不支持字幕同步，折腾一圈还是不满意。我后来发现了开源项目 Abogen：支持 ePub、PDF、纯文本等，一键转高质量音频，还能自动生成同步字幕。它底层用 Kokoro 语…

X AI KOLs Timeline ↗ · 2026-05-24 缓存

Abogen 是一个开源工具，可将 ePub、PDF 等文档一键转为高质量音频，并自动生成同步字幕，支持语音混合器和多种部署方式。

0 人收藏 0 人点赞

#pdf

如何从PDF中解析表格

Reddit r/AI_Agents ↗ · 2026-05-24

关于从PDF中解析表格的建议：将PDF转换为PNG并使用Gemini 3.1 Pro配合low thinking模式，声称准确率达95%。其他工具如Extend、Reducto、Landing在此任务中表现不佳。

0 人收藏 0 人点赞

#pdf

@knowledgefxg: 实用开源小工具推荐：pdf-inspector 解决的是一个很实际的问题：并不是所有 PDF 都需要 OCR。比方说你扔给它一个 PDF，它先判断这个 PDF 到底是什么类型——是正常的文字版（比如用 Word 导出的）、还是扫描版（图…

X AI KOLs Timeline ↗ · 2026-05-22 缓存

pdf-inspector 是一个开源的 Rust 库，用于智能分类 PDF 类型（文字版或扫描版），并提取文本和转换为 Markdown，避免不必要的 OCR，提高速度和节省成本。

0 人收藏 0 人点赞

#pdf

@FinanceYF5: 如何发挥Codex 最大价值 1/ Jason Liu 用 Codex 重新定义了知识工作 Codex 团队 DX 工程师、Instructor 创始人 jason 说：Codex 不只是写代码它已经成为跨越工具边界处理幻灯片、PDF、…

X AI KOLs Following ↗ · 2026-05-18 缓存

Jason Liu 分享了如何将 Codex 作为核心枢纽，跨工具处理幻灯片、PDF、电子表格等知识工作，最大程度发挥其价值。

0 人收藏 0 人点赞

#pdf

@VincentLogic: 做 RAG 最头疼的是什么？不是AI大模型，是文档解析啊！ PDF、Word、PPT 转 Markdown 转得乱七八糟，表格公式全乱套... 最近试了下 MinerU 3.1，真香了！一键转换，格式保留完美表格、公式、图片自动识别…

X AI KOLs Timeline ↗ · 2026-05-15 缓存

推荐MinerU 3.1文档解析工具，能完美将PDF、Word、PPT等转换为Markdown，支持表格、公式、图片自动识别，并提供三种模式（Pipeline/VLM），开源且可商用。

0 人收藏 0 人点赞

pdf

提交意见反馈