为多模型流水线构建路由层，根据优先级为每个请求选择正确的LLM

Reddit r/AI_Agents 2026/05/12 13:15 工具

llm-routing multi-model priority-based openrouter agent-pipelines dev-tool

摘要

一个路由层，根据优先级标志（速度、成本、质量、平衡）使用加权评分自动选择最佳LLM，决策时间低于1毫秒，内置回退、缓存和指标。

如果你正在构建需要链式调用多个LLM的智能体，可能会遇到这种情况：流水线中的每个步骤并不都需要相同的模型。快速提取步骤不需要Opus，最终综合步骤可能不应该使用Flash。但你最终还是会硬编码某个模型，希望它能适用于所有情况。这个路由器允许你为每个请求设置优先级标志（速度/成本/质量/平衡），并通过加权评分自动选择最佳模型。路由决策时间低于1毫秒，因为纯粹是数学计算，没有额外的网络跳转。如果所选模型失败，则自动回退；对重复请求使用Redis缓存；指标端点提供每个模型的p95/p99延迟。该路由基于OpenRouter构建，因此其目录中的任何模型都可使用。将其接入智能体流水线的LLM调用层会非常容易。GitHub仓库在下方评论中👇。本项目使用Neo AI Engineer构建。

查看原文

为多模型流水线构建路由层，根据优先级为每个请求选择正确的LLM

相似文章

@Modular：HTTP路由问题已经解决了多年。然后大语言模型出现了。它们的后端不是可互换的…

从早期经验中学习智能体路由

@amitiitbhu: 新文章：LLM 路由，阅读链接：https://outcomeschool.com/blog/llm-routing…

我们不再手动优化 LLM 技术栈——现在它实现了自我优化

TRACER：基于追踪的自适应成本高效路由用于LLM分类

提交意见反馈