diegosouzapw/OmniRoute
摘要
OmniRoute 是一个免费、开源的 AI 网关,连接超过 230 个提供商(包括 50 多个免费层级),具备智能路由和令牌压缩功能,可节省成本。它为 Claude Code、Cursor、Copilot 等各种 AI 工具提供统一端点。
查看缓存全文
缓存时间: 2026/06/30 11:25
diegosouzapw/OmniRoute 来源: https://github.com/diegosouzapw/OmniRoute # 🚀 OmniRoute — 免费 AI 网关 ### 永不停歇的编码。通过一个端点连接 236 个提供商 — 其中 50+ 免费 — 到每个 AI 工具。 将 Claude Code、Codex、Cursor、Cline、Copilot 以及 Antigravity 接入免费的 Claude / GPT / Gemini。自动回退。 RTK + Caveman 压缩可节省 15–95% 的 Token。永不触及限制。 每月约 16 亿次有文档记录的免费 Token — 注册后首月可达 约 21 亿 — 汇总自各免费层级,再加上长期免费、无上限的提供商长尾,以及上述压缩技术进一步扩展每个 Token 的使用。 (我们如何计算 →) 231 个 AI 提供商 50+ 免费 每月 16 亿免费 Token Token 节省 17 种策略 $0 起步 ### 💬 加入社区 Discord (https://discord.gg/EkzRkpzKYt) Telegram (https://t.me/omnirouteOficial) WhatsApp 全球 (https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) WhatsApp 巴西 (https://chat.whatsapp.com/BTGJXIyjeNIIgExvTMGGhI) 有问题、提供商技巧、路线图和支持 → Discord (https://discord.gg/EkzRkpzKYt) · Telegram (https://t.me/omnirouteOficial) · WhatsApp 🌍 全球 (https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) / 🇧🇷 巴西 (https://chat.whatsapp.com/BTGJXIyjeNIIgExvTMGGhI) npm (https://www.npmjs.com/package/omniroute) 许可证: MIT Node Stars (https://github.com/diegosouzapw/OmniRoute) npm 版本 (https://www.npmjs.com/package/omniroute) NPM 月下载量 Docker Hub (https://hub.docker.com/r/diegosouzapw/omniroute) Docker 拉取量 Electron 下载量 网站 (https://omniroute.online) 🚀 快速开始 • 🎯 组合 • 🌐 提供商 • 🔌 CLI 与 MCP • 🗜️ 压缩 • 🌍 网站 (https://omniroute.online) 💥 承诺 • 🤔 为什么 • 🏆 与众不同 • 🤖 兼容的 CLI • 🖥️ 运行环境 • 🔒 私有 • 🎬 实战演示 • 📚 探索更多 • 📧 支持 🌐 支持 41+ 种语言 🇺🇸 🇧🇷 🇪🇸 🇫🇷 🇮🇹 🇷🇺 🇨🇳 🇹🇼 🇩🇪 🇯🇵 🇰🇷 🇮🇳 🇹🇭 🇻🇳 🇮🇩 🇲🇾 🇵🇭 🇸🇦 🇮🇱 🇦🇿 🇺🇦 🇵🇱 🇨🇿 🇳🇱 🇧🇬 🇩🇰 🇫🇮 🇳🇴 🇸🇪 🇭🇺 🇷🇴 🇸🇰 🇵🇹 # 💰 约 16 亿免费 Token / 月 > 手动叠加免费层级很痛苦 — 数十个 SDK、数十个速率限制,并且不清楚实际拥有多少。OmniRoute 将 40+ 提供商池 / 500+ 模型 的有文档记录的免费层级汇总为一个真实数字,并在仪表板上实时显示 (/dashboard/free-tiers)。 - 每月约 16 亿免费 Token(稳定)— 注册后首月可达约 21 亿(含注册积分)。 - 池去重、诚实 — 我们每个共享免费池只计一次,因此标题数字不会像竞争对手数十亿的声称那样因速率限制上限而膨胀。(若按全天候计数每个速率限制,读数约为 100 亿;我们不发布这个数字。) - 还有不可计数的 — 永久免费、无 Token 上限的提供商(SiliconFlow、Z.AI GLM-Flash、Kilo、OpenCode Zen…)以及一个 10 美元的 OpenRouter 充值,可解锁 +2400 万/月,两者单独列出,从不夸大标题数字。 - 每个模型的详细分解,当前月份的已用/剩余实时数据,以及每个提供商透明的条款标志。 免费层级预算卡片(预览示意图) > 预览示意图 — 实际截图将在 /dashboard/free-tiers 页面验证后呈现。 完整方法(池去重、积分层级、提供商条款):docs/reference/FREE_TIERS.md。 # 💥 承诺 > 一个端点。236 个提供商。 永不停歇地构建 — 让 OmniRoute 为你选择最便宜且可行的那个。 🚫 永不触及限制在 236 个提供商之间毫秒级自动回退。额度用完?下一个提供商接管 — 零停机。 💸 节省高达 95% TokenRTK + Caveman 叠加压缩减少 15–95% 符合条件的 Token(工具密集型会话中平均约 89%)。 🆓 $0 起步50+ 个提供商提供免费层级,11 个永久免费(Kiro、Qoder、Pollinations、LongCat…)。无需信用卡。 🔌 所有工具均可使用16+ 个编码代理 — Claude Code、Codex、Cursor、Cline、Copilot、Antigravity — 通过单一配置。 🧩 一个端点OpenAI ↔ Claude ↔ Gemini ↔ Responses API 翻译。将任何工具指向 /v1 即可使用。 🛡️ 生产级断路器、TLS 隐身、MCP(87 个工具)、A2A、记忆、护栏、评估。共 14,965 项测试。 # 🤔 为什么选择 OmniRoute? > 不再需要同时管理 10 个仪表板、无效的 API 密钥和意外的账单。 | ❌ 日常痛点 | ✅ OmniRoute 如何解决 | | —————————————————— | —————————————————————————– | | 📉 订阅配额每月未使用便过期 | 最大化订阅利用率 — 跟踪配额,在重置前用尽每个 Token | | 🛑 速率限制打断编码过程 | 4 层自动回退 — 订阅 → API → 廉价 → 免费,毫秒级完成 | | 🔥 工具输出(git diff、grep、日志)消耗大量 Token | RTK + Caveman 压缩 — 每次请求节省 15–95% 符合条件的 Token | | 💸 昂贵的 API(每个提供商每月 $20–50) | 成本优化路由 — 自动路由到最便宜的可行模型 | | 🧰 每个 AI 工具需要自己的设置 | 一个端点,所有工具,一个仪表板 | | 🌍 AI 在您所在国家被屏蔽 | 3 级代理 + TLS 指纹隐身 — 从任何地方使用 AI | ┌──────────────────────────────────────────────────────────┐ │ 您的 IDE / CLI (Claude Code, Cursor, Cline...) │ └─────────────────────────┬──────────────────────────────────┘ │ http://localhost:20128/v1 ▼ ┌──────────────────────────────────────────────────────────┐ │ OmniRoute — 智能路由器 │ │ RTK + Caveman 压缩 · 17 种路由策略 │ │ 断路器 · TLS 隐身 · MCP · A2A · 护栏 │ └─────────────────────────┬──────────────────────────────────┘ ┌─────────────┬────┴────────┬─────────────┐ ▼ 第1层 ▼ 第2层 ▼ 第3层 ▼ 第4层 订阅 API 密钥 廉价 免费 Claude Code, DeepSeek, GLM $0.5, Kiro, Qoder, Codex, Copilot Groq, xAI MiniMax $0.2 Pollinations 额度用完? ───▶ 预算耗尽? ─▶ 预算耗尽? ─▶ 始终开启 # 🎯 组合 — 旗舰功能 > 组合是 OmniRoute 自动路由的一个模型链。当配额用完、提供商失败或成本激增时,组合会静默滑向下一个模型。这就是 OmniRoute 牢不可破的原因。 🛡️ ### ⚡ 零配置 — 只需使用 auto 无需创建组合。将模型设置为 auto(或其变体),OmniRoute 会根据您连接的提供商实时评分构建一个虚拟组合: | 模型 ID | 优化目标 | | ––––––– | ––––––––––––––––––––––––––––––– | | auto | 🎯 平衡默认(LKGP — 坚持您上次使用的良好提供商) | | auto/coding | 🧑💻 代码生成优先质量权重 | | auto/fast | ⚡ 最低延迟优先 | | auto/cheap | 💰 每个 Token 最便宜优先 | | auto/offline | 🔋 最大配额/速率限制空间优先 | | auto/smart | 🔭 质量优先 + 10% 探索以发现更好模型 | ## ### 🔀 或者自己构建 — 17 种路由策略 | 目标 | 策略 / 组合 | | ————————————— | ––––––––––––––––––––––––– | | 🥇 在付费前先用尽我的订阅 | priority / fill-first | | ⚖️ 跨账户分散负载 | round-robin · weighted · p2c · least-used | | 💸 始终使用最便宜可行的模型 | cost-optimized · auto/cheap | | 🧠 在模型间传递长上下文 | context-relay · context-optimized | | 🎲 随机 / 隐私路由 | random · strict-random | | 🧬 扇出到专家组并由评判者综合 | fusion | | 📊 根据剩余配额空间路由 | reset-window · headroom | | 🤖 让它智能判断 | auto (9 因子评分) · lkgp · reset-aware | Auto-Combo 引擎根据 9 个因子(健康度、配额、成本、延迟、成功率、新鲜度…)对每个候选评分 — 详见 docs/routing/AUTO-COMBO.md。 ## ### 🧱 内置三层弹性机制 | 层 | 范围 | 功能 | | ––––––––––––– | —————– | ––––––––––––––––––––––––––––––––––––– | | 🔌 断路器 | 整个提供商 | 阻止对上游故障提供商的重复请求;自动探测恢复 | | 💤 连接冷却 | 一个账户 / 密钥 | 在速率限制密钥上跳过,同时其他密钥继续服务 | | 🎯 模型锁定 | 提供商 + 模型 | 仅隔离某个配额受限的模型,不影响整个连接 | 组合: "始终在线" 策略: priority 1. cc/claude-opus-4-7 ← 订阅 (充分利用) 2. cx/gpt-5.5 ← 第二个订阅 3. glm/glm-5.1 ← 廉价备份 ($0.5/1M) 4. kr/claude-sonnet-4.5 ← 免费,无限制 (永不失败) 结果: 4 层回退 = 零停机 📖 Auto-Combo 引擎 · 弹性指南 # 🏆 OmniRoute 的与众不同之处 | 特性 | OmniRoute | 其他路由器 | | ––––––––––––––––––– | —————————————————————–– | ———–– | | 🌐 提供商 | 231 | 20–100 | | 🆓 免费提供商 | 50+ (11 个永久免费) | 1–5 | | 🔀 路由策略 | 17 (优先级、加权、成本优化、上下文中继、融合…) | 1–3 | | 🗜️ Token 压缩 | RTK + Caveman 叠加 (15–95%) | 无 / 20–40% | | 🧰 内置 MCP 服务器 | 87 个工具,3 种传输方式,30 个作用域 | 罕见 | | 🤝 A2A 代理协议 | 6 项技能,JSON-RPC 2.0 | 无 | | 🧠 记忆 (FTS5 + 向量) | 是 | 罕见 | | 🛡️ 护栏 (PII、注入、视觉) | 是 | 罕见 | | ☁️ 云代理 | Codex、Devin、Jules | 无 | | 🥷 TLS 指纹隐身 | 通过 wreq-js 实现 JA3/JA4 | 无 | | 🖥️ 多平台 | Web · 桌面 · Termux · PWA | 仅 Web | | 🌍 i18n | 42 个区域设置 | 0–4 | 📊 与 LiteLLM、OpenRouter 和 Portkey 的详细比较 → docs/comparison/OMNIROUTE_VS_ALTERNATIVES.md # ✨ 最新动态 > v3.8.20 → v3.8.41 的近期亮点。完整历史在 CHANGELOG.md 中。 - ⚖️ 配额共享路由 — 一种专用组合策略,根据_可用配额_跨账户分散负载:基于赤字轮询调度、每个连接 max_concurrent 及冷却等待队列、多窗口使用量桶(5 小时 / 7 天 / 每个模型)、每个 (密钥,模型) 上限、用于提示缓存完整性的会话粘性,以及基于上游 Token 使用头部的主动饱和检测。 → 弹性指南 - 🤖 一键 CLI/代理设置 — 专用 setup-* 命令为每个编码工具配置通过 OmniRoute 路由(Claude Code、Codex、Cline、Continue、Cursor、Roo Code、Kilo Code、Crush、Goose、Qwen Code、Aider、OpenCode);omniroute launch / omniroute launch-codex 是零配置启动器。 → CLI 集成 - 🛰️ 远程模式 — 使用作用域访问令牌从任何机器驱动远程 OmniRoute(omniroute connect / omniroute contexts / omniroute tokens),外加一个 omniroute login antigravity 辅助命令,可在您自己的机器上运行 Google“原生/桌面”OAuth,并将凭据 blob 粘贴到远程/VPS 安装(其中环回重定向无法访问)。 → 远程模式 - 🧭 更智能的自动路由 — OpenRouter 风格的 auto/: 组合(如 auto/coding:fast、auto/reasoning:pro),Fusion 策略(并行扇出到一组模型,然后通过评判者综合),任务感知路由(根据任务类型选择最佳连接),每个请求的 X-Route-Model 覆盖,实时 Arena-ELO + models.dev 模型智能,逐步账户允许列表,提供商通配符组合步骤,嵌套组合引用执行,粘性加权选择,以及 web_search 感知路由。 → Auto-Combo - 🗜️ 可插拔压缩 — 包含 9 个可组合引擎的异步流水线,配有 Compression Studios、LLMLingua-2 ONNX 引擎和启发式/SLM 双层 Ultra、RTK、委托的 Anthropic Context Editing、输出风格(输出轴转向:简洁散文 / 更少代码 / 简洁中文)、自适应上下文预算拨盘(仅升级到上下文窗口所需的程度)、每个请求的 x-omniroute-compression 控制、可选离线评估框架、从仪表板一键管理 Headroom 代理生命周期(支持 Docker sidecar)、合成压缩游乐场(Play 通道 + A/B 比较,附带美元上限保真度判定)、可选逐步保真度门控(在降级提示前拒绝有损引擎)、最佳 N 候选编码器(GCF vs TOON — 保留较短者,在工作室中附带 A/B 字节/Token 表)、CCR 范围/grep/统计检索(提取存储块的精确字节/行切片或摘要,而不是重新展开),以及统一面板,带有命名配置文件 + 活动配置文件选择器。 → 压缩 - 🕵️ 透明 MITM 解密 (TPROXY) — 捕获并转换来自忽略代理环境变量的 CLI 的流量,具有每个 SNI 的证书颁发机构和信任存储安装程序。 → MITM/TPROXY - 💸 无处不在的成本遥测 — 每个端点(包括媒体)上的 X-OmniRoute-* 成本/使用量头部、非 Token 成本引擎、缓存命中 X-OmniRoute-Cost-Saved 头部,以及每个密钥的美元消费配额。 → API 参考 - 🧠 您掌控的记忆 — 可选 int8 向量量化(Qdrant + sqlite-vec),默认关闭,每个请求的 x-omniroute-no-memory 头部。 → 记忆 - 🛡️ 安全 — 跨所有 LLM 路由的提示注入防护(由红队套件支持),外加免费的 DuckDuckGo 最后手段网络搜索。 → 护栏 - 🤝 更多提供商和代理 — Cursor Cloud Agent(第 4 个云代理)、CodeBuddy CN (copilot.tencent.com)、Google Flow 视频生成提供商、新网关 DGrid 和 Pioneer AI (Fastino Labs)、入站 xAI Grok 翻译器以及 Grok Build (xAI) 的 OAuth 导入 Token 流、GitHub Copilot 提供商上的 GPT-4 / GPT-4o-mini、多模型 Factory Droid、ZenMux Free(会话 Cookie 免费层)、阿里巴巴 DashScope 文本到视频 (wan2.7-t2v)、刷新后的 236 提供商目录(OrcaRouter、Wafer AI、OpenAdapter、dit.ai、TokenRouter 等)、Vertex AI 媒体生成(语音 / 转录 / 音乐 / 视频),以及从 CLIProxyAPI (~/.cli-proxy-api/) 一键导入账户。 → 提供商 - ⚡ 本地性能和基础设施 — 一键本地 Redis 启动器(omniroute redis up,外加仪表板 Redis 面板)、一键 Cloudflare Workers 和 Deno Deploy 中继部署器连接到代理池,以及可选的 Bifrost Go sidecar,可卸载最热的中继路径(BIFROST_BASE_URL,超时时自动回退到 TypeScript 路径)— 现在配有中继后端选择器(OMNIROUTE_RELAY_BACKEND=ts|bifrost|auto),使 /v1/relay 端点保持稳定表面,同时在内部选择最快的后端。 → 环境 # 🤖 兼容的 CLI 与编码代理 > 一个配置 — http://localhost:20128/v1 — 即可让每个 AI IDE 或 CLI 运行在免费和低成本的模型上。 Claude Code Codex CLI Cursor Copilot Continue OpenCode Kilo Code Droid OpenClaw Kiro Command + 同样适用
相似文章
@IndieDevHailey: 最强开源AI网关神器:OmniRoute,一个本地端点,搞定236个AI模型 免费开源AI网关,把236个提供商(90+免费、11个永久免费)统一成一个OpenAI兼容接口。本地自托管,3分钟部署完成。 - 永不断流:自动fallback…
OmniRoute是一个免费开源AI网关,能够将236个AI提供商的API统一成一个OpenAI兼容接口,支持本地自托管、自动fallback、智能路由和token压缩等功能。
@VaibhavSisinty:我刚刚发现了一个工具,能将AI代币成本降低95%,并且每月提供16亿免费代币。这是最……
OmniRoute 是 GitHub 上一个热门的工具,它通过压缩 AI 提示词,将代币使用量减少高达 95%,并通过无缝路由请求到多个提供商(如 Claude Code、Codex、Cursor、Cline 和 Copilot),每月提供 16 亿免费代币。
@geekbb: 开源的 AI Agent 元编排框架,为 Claude Code、Codex、Cursor、OpenCode、Hermes、Pi 等多种 Agent 提供统一的编排层。用户可以在不同设备(终端、浏览器、手机、桌面应用)间无缝切换会话,让多…
Omnigent is an open-source meta-orchestration framework that provides a unified orchestration layer over multiple AI agents like Claude Code, Codex, and Cursor. It enables seamless cross-device session switching, multi-agent collaboration, policy enforcement, and cloud sandbox execution.
decolua/9router
9router 是一款开源工具,通过将各类编程助手与多个 LLM 提供商连接,并具备自动故障转移和 Token 减少功能,从而实现无限免费 AI 编程。
Openrouter Fusion API
OpenRouter的Fusion API提供定价和提供商信息,用于跨多个提供商路由AI模型请求,从而实现对各种AI模型的灵活且成本效益高的访问。