Show HN: peerd – 完全在浏览器中运行的 AI 代理工具集

Hacker News Top 工具

摘要

peerd 是一个开源浏览器扩展,作为 AI 代理工具集,使代理能够在无需后端的情况下完全在浏览器内运行,利用 WebAssembly 进行沙箱计算,并通过 WebRTC 实现点对点代理通信。

嘿,HN。<a href="http:&#x2F;&#x2F;peerd.ai" rel="nofollow">http:&#x2F;&#x2F;peerd.ai</a> 是一个完全驻留在浏览器中的 AI 代理工具集,以网页扩展的形式存在。你无需安装单独的“AI 浏览器”,也无需附加或运行外部进程,或管理笨重的 MCP 集成。它就是一个完全自包含的网页扩展,采用零构建的纯 JavaScript 编写,尽量减少非浏览器依赖,使用你自己的提供商密钥,且采用 Apache 2 许可证。<p>这不仅仅是一个有趣的噱头。虽然它基本上是一个个人副业项目,但我由衷相信,浏览器和网页可以成为 AI 代理安全、自主运行的最自然平台,而且更重要的是,无需 A2A 中间人(稍后会详细说明)。为了证明这一点,peerd 不仅仅驱动浏览器自动化。它利用标签页和工作实例来启动隔离的沙箱,以支持各种真实工作负载类型。这些包括无头 JS 计算工作、可视化 JS 笔记本、个人客户端应用,以及基于 wasm 并具备完整 HTTP 网络功能的真实 Linux 虚拟机。<p>过去几个月的行业讨论一直被“哪种底层平台最适合 AI 代理沙箱”所主导,许多互相竞争的答案聚焦于不同的模型和用例。Cloudflare 是最突出的例子之一,它将其基于 v8 隔离的工作器定位为同类最佳解决方案,理由是启动速度快于容器且隔离保证强。v8 隔离当然是 Chromium 的产物,而 Chromium 在全球数十亿浏览器上免费运行。浏览器本身可能是整个软件行业中经过最充分实战检验的沙箱系统。它建立在 30 年应对恶意内容、恶意代码和恶意用户的学习基础之上。原生和云端代理必然要从零开始重建全部或大部分这种防御姿态。peerd 则不然。它充分利用了浏览器的一切,并将其推向功能极限,同时继承了宿主系统的安全基线和隔离性。<p>强大的沙箱并不是浏览器提供且 peerd 使用的唯一特性。它还带来了极其强大但常被低估的原始能力,包括 webCrypto、webRTC、webAuthn、webGPU,以及即将推出的 WebNN。直接访问网页(附带你的真实活动会话)以及使用 fetch 进行 API 调用,呈现了一种替代 MCP 集成的模型。代理可以在标签页中直接编写并生成网页应用,无需任何托管服务。然后是 A2A 部分:peerd 已经利用 webRTC 建立了一个初步的 p2p(peerd-to-peerd?)网络。今天,你可以与网络上的对等方连接,将他们添加为联系人,并分享你创建的签名应用。我正在努力扩展这些应用,使其能够利用同样的 p2p 网络来支持去中心化网页应用(dwapps),并促进真正的点对点 A2A,无需任何平台或中间人。<p>鉴于这是一个早期兼职项目,这是一个非常实验性的构建,处于 v0.x 预览状态。我特意尝试解决致命三角问题:主代理循环/会话从不摄取不受信任的 DOM 代码,也不拥有低层导航工具。它将这些任务委托给专用的网页运行器,这些运行器没有更广泛的工具或密钥访问权限,仅返回摘要结果。DOM 和摘要结果都被标记为不可信,意味着需要突破两层叠加的提示注入防护。所有出站流量都经过一个中心模块,该模块具有可定制的拒绝列表,并且仅允许对指定允许端点的模型调用。更多详情请参阅文档、网站和代码本身。最终,请自行承担使用风险。<p>目前支持 Anthropic、Open Router、本地 Ollama,甚至还有 Gemma 的实验性 WebGPU 实例。<p>诚实的限制:Chrome 网上应用店和 AMO 的审核仍在进行中,需要更多关注和实际使用。从 GitHub 直接加载已解压的扩展是最简单的方式,而且由于无需构建,审查起来也很方便。基于 wasm 的 Linux 依赖于 Cheerpx 引擎,该引擎并非开源,且对商业使用有限制。这可能是重新评估其替代方案的一个好理由,但它也是性能最好的,并且看起来最接近于实现 64 位支持。<p>欢迎探索、使用、批评,并享受其中的乐趣。
查看原文
查看缓存全文

缓存时间: 2026/06/24 16:53

https://github.com/user-attachments/assets/d2e4c285-6952-4c95-bf5a-d06087de084d

相似文章

Show HN: Paseo – 美观的开源编程助手界面

Hacker News Top

Paseo 是一个开源界面,将多种编程助手(Claude Code、Codex、Copilot、OpenCode、Pi)整合到单一的自托管平台中,支持语音控制、跨设备使用,并以隐私优先为设计理念。