@QingQ77: 一句话告诉 Agent 要操控哪个网站,它自动帮你生成 CLI 工具,直接走你已登录的 Chrome 浏览器,不用调 API 或搞 token。 https://github.com/better-world-ai/x-cli… x-cl…
摘要
x-cli 是一个开源项目,通过 AI agent 自动生成操控网页的 CLI 工具,利用 Chrome 已登录会话,无需 API 或 token。支持安装 Kimi WebBridge 插件后一句话生成 CLI,已内置百度搜索、Google 搜索等示例工具。
查看缓存全文
缓存时间: 2026/05/18 08:30
一句话告诉 Agent 要操控哪个网站,它自动帮你生成 CLI 工具,直接走你已登录的 Chrome 浏览器,不用调 API 或搞 token。
https://github.com/better-world-ai/x-cli…
x-cli 的玩法是装上 Kimi WebBridge 插件后,对 Agent 说一句“帮我给某网站做个 CLI“,Agent 会先问你要哪些功能,然后自己去分析页面、写代码、生成工具。最后你拿到的 CLI 能直接控制你 Chrome 里已登录的会话,不走 API。仓库里给了四个成品:百度搜素、Google 搜索加抓取、Nano Banana 出图、ChatGPT 出图,都是 Go 写的。
better-world-ai/x-cli
Source: https://github.com/better-world-ai/x-cli
x-cli
你想在网页上反复做的事,一句话告诉 AI agent,它就能帮你做成 CLI 工具。生成的 CLI 让 agent 随时调用,直接驱动你真实的 Chrome 登录态,不走 API,不折腾 token。
仓库里收录了几个这样做出来的 CLI,既能装好就用,也作为参考案例,演示 AI agent + kimi-webbridge 是怎么从一句需求生成一个完整 CLI 的。后文「自己做一个新 CLI」会走完整流程。
DEMO(一个 CLI 的诞生过程):
https://github.com/user-attachments/assets/c1d04187-972a-4b8a-b243-df085281fc77
自己做一个新 CLI
仓库里几个 CLI 都是用 skills/agent-cli-creator/ 这个 skill,让 AI agent 自动产出的。给你的 agent 装好下面这一套,对它说一句「帮我给 example.com 做个 CLI」就行。
前置依赖
要让 agent 真正控制你的浏览器,需要装 kimi-webbridge。它分两部分:
-
浏览器插件,agent 控制浏览器的入口工具。装好之后,所有点击、输入、读取都通过它转发,你登录过的 Chrome 会话自动被复用。
-
本地 skill,让 agent 知道怎么用上面那个插件。装好:
curl -fsSL https://kimi-web-img.moonshot.cn/webbridge/install.sh | bash
安装 skill
npx skills add better-world-ai/x-cli
没有 Node.js?手动安装
把 skills/agent-cli-creator/ 复制到你 agent 的 skills 目录即可(Claude Code 是 ~/.claude/skills/)。不确定路径?把这一段 README 丢给你的 agent,它会自己判断。
装完就能用,对话里说一句「帮我给 example.com 做个 CLI」即可触发。
怎么用
- 启动 kimi-webbridge,并在 Chrome 里登录目标网站。
- 对 agent 说,比如:
“帮我做一个 example.com 的 CLI,我要能拉首页信息流,并且能发评论。”
- agent 会先问你几个问题(用什么语言、前 1–3 个功能是什么),然后自己去分析站点、搭脚手架、实现命令,关键节点会停下来确认。
- 最终你会拿到一个这样用的工具:
example-cli login-status example-cli home --limit 10 example-cli post --content "hello"
包含的 CLI
| 工具 | 一句话 |
|---|---|
baidu-cli | 百度搜索,输出 JSON |
google-cli | Google 搜索 + 网页抓取,输出 JSON |
nanobanana-cli | 用 Gemini 2.5 Flash Image (Nano Banana) 生成图片 |
chatgpt-image-cli | 用 chatgpt.com/images 生成图片 |
安装预编译二进制
去 Releases 页面 下载对应平台的归档,解压即可用。
macOS 打开提示
遇到「无法打开,因为开发者身份未验证」时,执行:
xattr -d com.apple.quarantine ./<cli-name>
本地编译
git clone https://github.com/better-world-ai/x-cli
cd x-cli/<某个-cli>
go build -o ./<cli-name> .
License
MIT,见 LICENSE。
相似文章
@quant_sheep: 我让 Agent 通过 Chrome 帮我在 Airbnb 上找住处并完成预约了 它甚至还主动帮我咨询房东:有没有厨房 如果你需要让自己的 Agent 像人一样操作浏览器,不管是测试网页,还是自动预订 Airbnb 住宿,涉及网页的操作都…
展示了一个名为 open-browser-use 的开源工具,能让 AI Agent 像人一样操作 Chrome 浏览器,完成在 Airbnb 上查找住处并预约的全流程,包括主动咨询房东。
@daweifs: AI Agent 必备神器:CLI-Anything Hub 一句话:任何 GUI/SaaS/桌面软件,都能一键变成 AI 原生 CLI! Agent 再也不用“帮我点按钮”了,直接一条命令搞定! 核心亮点: • 76+ 现成 CLI,覆…
CLI-Anything Hub 是一个开源工具,能将任意 GUI 或 SaaS 软件一键转化为 AI 原生 CLI,让 AI Agent 直接通过命令行操作,无需人工点击。目前已提供 76+ 现成 CLI,覆盖 31 类软件,并兼容 Claude Code、Cursor 等主流 Agent 框架。
@jakevin7: OpenCLI 一键打通 Agent 的 Twitter 世界! 发推、回复、引用转推、监控通知、关键词触发自动回 DM、把整条 thread 抓下来总结、批量整理 list、定期备份某个人的所有图和视频——你想到的客户端操作,Agent…
OpenCLI 是一个工具,允许 AI Agent 通过复用浏览器登录态(无需 X API key)无缝操作 Twitter,实现发推、回复、监控、抓取总结等 36 种客户端命令,将 Twitter 变成 Agent 的完整生活场景。
@GitHub_Daily: 让 AI Agent 自动化操作浏览器或抓数据,经常被各种反爬机制拦截,遇到验证码、人机验证直接卡死。 最近 BrowserAct 团队开源了一个 Skill,专为 AI Agent 设计的浏览器自动化命令行工具。 提供三层反封锁机制,从…
BrowserAct 团队开源了一个专为 AI Agent 设计的浏览器自动化命令行工具,提供三层反封锁机制(指纹伪装、验证码破解、人类接管),支持多浏览器并行、账户隔离,并优化了输出格式以节省Token。
@shao__meng: Chrome DevTools for Agents 1.0 正式发布 https://developer.chrome.com/blog/devtools-for-agents-v1… 它在真实浏览器中观察行为、检查输出,让 Agent…
Chrome DevTools for Agents 1.0 正式发布,为AI编码Agent提供实时浏览器调试能力,支持MCP服务器、CLI和Agent技能三种接入方式,包含Lighthouse审计、模拟、扩展调试等七大能力。