“代理需要浏览器”问题——我开源了自己的解决方案
摘要
Otto (MIT) 是一个开源浏览器扩展,它通过 CLI 或代理将真实标签页转化为可控节点,解决了“代理需要浏览器”的问题,无需无头农场或昂贵的云服务。
构建代理时一个反复出现的痛点就是浏览器上下文:无头农场运行起来很麻烦,且行为与真实会话不同;云浏览器服务则很快变得昂贵。Otto (MIT) 采取了不同的路线——一个轻量级扩展将真实标签页转化为可控节点,通过安全中继由 CLI 或代理驱动。确定性代码处理交互,因此模型只需推理策略。这不是产品推销——它是免费且开源的——更想知道这里其他人是如何为代理解决真实浏览器上下文的。仓库在评论中。
相似文章
“浏览器代理成本高昂且仍在成熟”这种表述可能忽略了架构方面的问题
讨论了当前使用无头Chrome加AI层的浏览器代理的架构问题,并介绍了Opera Neon的命令行界面作为替代方案,将AI集成到浏览器中,从而降低令牌开销并提高理解能力。
我构建了 agent-browser,但用于操作系统自动化。
作者介绍了 agent-ctrl,这是一个基于 Rust 的开源 CLI 工具,允许 AI 代理通过辅助功能树与原生应用程序 UI 进行交互,从而实现操作系统自动化。
@svpino: 我还没见过在浏览器中运行的智能体不让人觉得是取巧之作。我试过无头浏览器,但无法…
Santiago (@svpino) 讨论了在浏览器中运行AI智能体的挑战,而 @ego_agent 宣布了 'ego lite',一个内核级重建,旨在让AI智能体更快、更可靠。
[browser-use-wasm] 我制作了一个在WASM中运行的零成本浏览器使用代理
一位开发者构建了一个完全自包含的浏览器使用代理,完全在WASM/WebGPU中运行,零服务器成本,通过自然语言提示实现完整的网页控制。
我给了你的代理访问 Firefox 的权限——认识一下 Firefox CLI
一个新的命令行工具 Firefox CLI,允许 AI 代理控制真实的 Firefox 浏览器会话,提供了相当于 Agent Browser 的 Firefox 版本,并改进了功能,如永久扩展安装和独立的代理窗口。