Show HN: Dari-docs – 使用并行编码代理优化你的文档

Hacker News Top 工具

摘要

dari-docs 是一个 CLI 工具,通过模拟 AI 代理执行任务来测试文档质量,识别代理卡住的地方,并可选择生成改进文档清晰度的编辑建议。

众所周知,现在文档需要针对 AI 代理进行优化——我们都在将 Claude Code / Codex / Pi 代理指向文档,并期望模型能弄清楚如何实现一个产品。<p>然而,这改变了编写文档时的整个优化问题。良好的文档现在变得更客观——你在解决一个非常具体的问题:一个运行最愚蠢模型的愚蠢框架能否可靠地实现这个功能?<p>人类通常能够弥补术语不一致或跨页面上下文分散的问题,但对代理来说,这通常会浪费时间(甚至完全混淆代理)。<p>我们围绕这个概念构建了一个名为 dari-docs 的小项目:用户可以通过网站或 CLI 上传文档,并在不同提供商之间运行代理,以查看它们在哪里出错。你可以上传文档,提供一系列任务,并让具有不同智能/成本水平的代理并行完成这些任务。运行完成后,你会从每个代理运行中获得一份反馈 markdown 文件列表,并可以根据代理反馈应用更改。<p>托管服务:<a href="https://optimize.dari.dev/">https://optimize.dari.dev/</a>,仓库链接:<a href="https://github.com/mupt-ai/dari-docs" rel="nofollow">https://github.com/mupt-ai/dari-docs</a><p>代理实际上会尝试端到端地使用产品。他们会搜索文档、遵循指令、运行命令、尝试示例,并尝试调试失败。重要的是,这不是对文档的静态 LLM 审查。代理实际上是在尝试集成。<p>你还可以使用测试凭据启用实时验证,这样代理就可以针对真实 API 验证工作流程:<p><pre><code> dari-docs check . --live-verify --secret-env DARI_TEST_API_KEY --task "Create a checkout session" </code></pre> 如果你正在构建 CLI、API、MCP 服务器或 SDK,并主动为人类或代理维护文档,我们很乐意与你合作,并在真实工作流程上测试这个工具!
查看原文
查看缓存全文

缓存时间: 2026/05/20 23:30

mupt-ai/dari-docs

来源:https://github.com/mupt-ai/dari-docs

dari-docs

让你的文档优秀到连最笨的智能体都能用它交付。

dari-docs 是一个 CLI 工具,用于测试你的文档是否足够清晰,能够让智能体顺利使用。它会将你的文档发送给模拟的开发者智能体,要求它们完成实际任务,报告它们在哪些地方卡住了,并可以根据这些反馈生成建议的文档修改。

用它来把文档质量从“似乎能看懂”提升到“智能体确实能完成任务”。

为什么用 dari-docs?

过去好的文档意味着“开发者最终能弄明白”。但这已经不够了。

当阅读者是智能体时,歧义变得可量化。不一致的术语、隐藏的假设、分散的上下文以及缺失的配置步骤,都会增加智能体失败或浪费上下文来推断文档意图的可能性。

dari-docs 为智能体可读的文档提供了一个可重复的反馈循环:定义任务、运行模拟用户、检查失败点,并可选地拉回修改后的文档。

它能做什么

  • 用模拟开发者测试文档——智能体仅使用你提供的文档来尝试完成具体任务。
  • 发现阻碍任务的歧义——报告缺失的上下文、不清晰的配置、不一致的术语,以及代理不得不猜测的地方。
  • 生成建议的修复——optimize 命令将测试者的反馈转化为修改后的文档,你可以在本地查看。
  • 支持托管或自主管理——使用托管的 dari.dev Docs 服务,或者在你自己的 dari.dev 组织中运行智能体。
  • 使用普通的智能体项目——测试者和编辑者只是提示词、技能、配置脚本和 dari.yml 清单的文件夹。

安装

使用安装脚本安装最新的 dari-docs 二进制文件,然后验证 CLI 可用:

curl -fsSL https://raw.githubusercontent.com/mupt-ai/dari-docs/main/install.sh | bash
dari-docs --help

快速开始

托管模式使用托管的 dari.dev Docs 服务和单独的 dari.dev Docs 信用额度。新账户初始拥有价值五美元的免费信用。

从你的文档仓库中运行:

dari-docs auth login

运行文档检查:

dari-docs check . \
  --managed \
  --task "安装 SDK 并进行第一次 API 调用"

该命令提交一个托管运行并打印运行 ID。要在同一命令中等待完成,请添加 --wait

生成建议的文档修改:

dari-docs optimize . \
  --managed \
  --wait \
  --task "安装 SDK 并进行第一次 API 调用"

使用 --wait 时,修改后的文件会下载到 .dari-docs/updated/ 目录中,不会修改你的仓库。查看该文件夹,并在准备好后将更改复制到仓库中。

工作原理

  1. 你将 dari-docs 指向一个文档目录或公开文档 URL,并提供一个或多个任务。
  2. CLI 打包你的本地文档,或者将公开文档 URL 传递给检查智能体(带有互联网访问权限),然后向托管的 Dari Docs 智能体提交运行。
  3. 测试智能体尝试完成任务,并报告文档在哪些地方阻碍了进度。
  4. 使用 dari-docs runs waitdari-docs runs download--wait 来收集本地运行产物。
  5. 如果运行 optimize,编辑智能体会提出文档更改建议。
  6. 建议的修改可以下载到 .dari-docs/updated/ 目录中进行审查。

模拟用户是普通的 dari.dev 智能体。托管模式自动使用托管的 Dari Docs 测试者和编辑智能体。如果你想自定义智能体提示词、技能、配置脚本或 dari.yml,请使用自主管理模式。

托管模式 vs 自主管理

模式何时使用需要
托管想要最快速的设置和托管执行。dari-docs auth login
自主管理想在你自己的 dari.dev 组织中运行。dari.dev API 密钥和已部署的智能体

大多数用户应从托管模式开始。

文档

相似文章

Show HN: Codiff,本地差异审查工具

Hacker News Top

Codiff 是一款轻量级本地 diff 查看器,用于审查 Git 暂存和未暂存的更改,支持基于 LLM 的逐步讲解和内联审查评论。

将 hf CLI 设计为适合 Hub 使用的 Agent 优化工具

Hugging Face Blog

Hugging Face 重新设计了其 `hf` CLI,使其同时面向人类用户和 Claude Code、Codex 等 AI 编程 Agent 进行优化,具备 Agent 感知的输出渲染能力,基准测试显示在复杂任务上相比不使用 CLI 的方案最高可节省 6 倍的 token 消耗。