我构建了AgentLighthouse——一个本地的“AI代理灯塔”,用于扫描仓库/文档/API以评估代理就绪状态
摘要
AgentLighthouse 是一个本地优先的工具,用于扫描仓库、文档和API,评估AI编码代理(如 Codex、Claude Code、Cursor)能够多大程度上理解和正确使用一个项目。它会检查代理指令文件、文档质量、设置清晰度、OpenAPI 操作质量、MCP 工具描述等。
你好,这个想法源于越来越多的人(包括我)在使用 Codex、Claude Code、Cursor、Copilot、MCP 工具等,但这些工具目前仍然只为人类编写。代理可能会失败,难以使用你构建的东西,因为设置命令不清晰、文档过时、OpenAPI 操作描述不足、MCP 工具含糊不清,或者缺少 AGENTS.md/CLAUDE.md/llms.txt/benchmark 文件。因此,我的项目 AgentLighthouse 试图回答:“一个 AI 编码代理能否正确理解并使用这个项目?”它会扫描以下内容:
* 代理指令文件
* README/文档质量
* 设置/测试/lint 命令清晰度
* OpenAPI 操作质量
* MCP 工具描述/输入模式
* 任务基准测试
* SARIF/CI 就绪状态
* 基线比较和 PR 回归
它是本地优先的,不调用任何付费 LLM API。它既不是 AI 代理,也不是 SaaS。请不要喷我,因为我并没有从中获利 😄。目标是让现有代理更容易使用项目。试试:npx @agentlighthouse/cli scan . 或者生成报告:npx @agentlighthouse/cli@alpha scan . --report-dir agentlighthouse-reports 这仍然是 alpha 版本,我主要想听取真实开发者的反馈。谢谢阅读 :)
相似文章
AI代理项目的开源开发工具
AgentLantern 是一个面向AI代理项目的开源开发工具,帮助记录、分析、验证和可视化代理工作流,最初支持CrewAI,并计划扩展到其他框架。
AI 代理依然拉胯,于是我自己造了一个
作者构建了一款自定义 AI 代理应用,封装了 Claude Code 并即将支持 Codex,侧重于可组合的工作流,并期待社区反馈。
@hwchase17: https://x.com/hwchase17/status/2053157547985834227
文章概述了一个系统的“智能体开发生命周期”(构建、测试、部署、监控),以有效创建和管理 AI 智能体,重点介绍了 LangChain、LangGraph 和 CrewAI 等关键框架。
我厌倦了AI开发工具把一切都困在云端,所以我构建了...
AgentBuddy 是一个本地优先、开源的 AI 工作流沙盒,支持持久化代理线程、实时执行追踪和事件驱动工作流,集成了 Claude Code,旨在让 AI 开发保持本地化和透明化。
@benhylak:我们构建了第一个本地调试智能体的合理方法。你可以查看你的追踪记录。codex/claude code 也可以。这允许……
一个新的开源工具可以通过查看追踪记录实现AI智能体的本地调试,允许使用codex和Claude code等工具自动编写评估并进行测试。