标签
LiteParse 是一款在本地运行的快速文档解析工具,通过跳过繁重的AI处理和云端开销,实现了约3ms/页的解析速度。它采用确定性的布局启发式算法和选择性OCR,直接输出结构化的Markdown,非常适合实时RAG流水线和编码代理。
介绍了一个名为 Tolaria 的开源项目,它被认为是 Obsidian 的强劲对手,结合了 Obsidian 的 Markdown 笔记、Git 版本控制和 AI Agent 工作区功能,具有本地优先、无账号等特点。
这篇推文汇总了6个开源工具,涵盖PDF转markdown、文档理解、OCR、论文翻译和自动文献综述,旨在打通文档工作流。
Obsidian 不仅仅是一个笔记应用,更是一个面向 AI 推理系统的上下文层,因为它以纯文本 Markdown 文件存储笔记,AI 可以直接无摩擦地读取。文章概述了将 Obsidian 转变为推理基础的三种构建方式,包括一个 CLAUDE.md 文件,用于向 AI 灌输个人思维模式。
谷歌实验室发布了 DESIGN.md,这是一份规范,通过 YAML 设计标记和 markdown 说明来定义 AI 编码代理的视觉标识,从而实现一致的界面生成。
一篇保姆级教程,介绍如何用30分钟为AI Agent搭好持久记忆,使用开源的EverOS工具,将记忆存储为可编辑的Markdown文件,无需Docker或向量库集群。
介绍Agent memory创业的几种主流思路,并推荐EverMind团队的开源项目EverOS,它提供以Markdown为源的本地记忆操作系统,支持双轨记忆、多模态摄取和自演化能力。
介绍了五个开源工具(MarkItDown、MinerU、Docling、marker、surya),用于将PDF、Office文档等转换为Markdown或JSON,以便直接供RAG或AI代理使用。
作者分享如何通过开源框架EverOS将Claude Code的对话记忆存储为本地Markdown文件,并在Obsidian中管理,实现跨session记忆持久化。
一个20行的markdown文件在GitHub上获得了45,000颗星,展示了精心设计的提示可以产生的巨大影响。
描述了一个自托管解决方案,使用 SearXNG 进行搜索、Scrapling 和 Trafilatura 进行页面提取,为本地 AI 代理提供网络访问,从而避免使用付费 API。
介绍如何使用 Obsidian 和 Claude Code 搭建本地 AI 知识库,通过创建文件夹结构、编写 CLAUDE.md 规则文件、分步导入和整理资料,实现长期可迁移的个人知识管理。
LiteParse 是一个快速、开源的文档解析器,在不使用 AI 模型的情况下,其在 Markdown 解析方面的表现优于一些前沿 VLM。它支持多种语言和平台,由 LlamaIndex 开发。
Google宣布了Open Knowledge Format,这是一个基于Karpathy的LLM wiki概念的开放标准,旨在通过简单的Markdown文件为AI代理提供上下文。
Pagecast 是一款本地优先的工具,用于预览和发布 Markdown/HTML 报告到 Cloudflare Pages,具备密码保护和智能体集成等功能。
LiteParse v2.1 发布,提供了最快的无 LLM PDF 转 Markdown 转换,在无模型工具中基准测试得分最高。
Emacs 31 即将到来,带来了更简单的 tree-sitter 配置和内置的 markdown-ts-mode 等改进。本文详细介绍了作者在开发分支中使用的一些特性,强调了配置工作量的减少。
安德烈·卡帕西展示了一个免费的基于Obsidian的知识管理系统,利用Claude Code和Markdown文件结构替代了昂贵的RAG设置,能够处理数千份文档,且只需极少的工具调用。
Kwipu是一个新的开源本地Graph RAG系统,它将Markdown和Obsidian笔记索引到属性图中,支持通过混合检索进行自然语言查询,并通过Ollama支持本地LLM。