model-routing

#model-routing

@loretoparisi: LLM Fusion 时代刚刚开始。

X AI KOLs Following ↗ · 2天前缓存

Sakana AI 发布了 Fugu Ultra，这是一个编排层，通过统一的 OpenAI 兼容端点将子任务路由到多个模型，性能与领先系统相当。

0 人收藏 0 人点赞

#model-routing

@amitiitbhu: https://x.com/amitiitbhu/status/2069023290182758497

X AI KOLs Timeline ↗ · 2天前缓存

详细博客文章，解释Sakana Fugu技术报告，该报告介绍了将任务路由到专业模型以实现集体智能的编排器AI模型。

0 人收藏 0 人点赞

#model-routing

@levie: 过去几个月，我们可能正在见证应用AI层在大规模场景下的模样。尽管一些初步的批评认为这只是LLM之上的一层薄薄封装，但事实证明，在企业中驱动自动化工作流远比想象中复杂得多。而任何存在复杂性的地方，随着时间推移，通常都会形成护城河并创造价值。

X AI KOLs Following ↗ · 6天前缓存

对企业中新兴应用AI层的分析，概述了关键组成部分：构建工作流特定功能、智能模型路由、通过FDE进行变更管理以及领域特定的市场策略。文章认为，尽管存在一些批评，这一层将创造可持续的护城河和价值。

0 人收藏 0 人点赞

#model-routing

@OrcaRouter: Fable 5 已死。我们刚刚将其复活——更便宜、更开放，密钥由你掌握。OpenRouter 在 48 小时前取消了 Fusion，而且……

X AI KOLs Timeline ↗ · 2026-06-15 缓存

OrcaRouter 是一个新的 AI 网关，它智能地将提示路由到最佳模型，提供成本节省、护栏和完全可观测性，零代币加价并有免费层级。

0 人收藏 0 人点赞

#model-routing

如何高效构建 Microsoft AI agent framework

Reddit r/AI_Agents ↗ · 2026-06-14

关于在 Microsoft Agent Framework 中通过使用网关进行缓存、上下文压缩和模型路由来优化成本的实用指南，确保每个步骤仅使用必要的智能。

0 人收藏 0 人点赞

#model-routing

@levie：能够为特定任务路由到最佳AI模型的层，其价值将大幅提升。这…

X AI KOLs Following ↗ · 2026-06-14 缓存

一条推文指出，由于成本优化、能力差异和风险缓解，在AI模型之间进行路由的层将变得越来越有价值，同时引用了OpenRouter的Fusion API公告。

0 人收藏 0 人点赞

#model-routing

@avyvar: Token-maxxing 已经失控了。大多数 AI 应用把每个请求都发给最大的模型，即便小模型就能完成任务。

X AI KOLs Following ↗ · 2026-06-11 缓存

该推文批评了 AI 应用过度使用大型模型，并介绍了旨在根据不同请求匹配合适模型规模以提高效率的 Dari Router 工具。

0 人收藏 0 人点赞

#model-routing

@canghe: https://x.com/canghe/status/2064983863349403998

X AI KOLs Timeline ↗ · 2026-06-11 缓存

OpenSquilla 是一个开源项目，通过 MetaSkill 3.0 实现 Agent 自组织技能编排，结合智能路由降低 token 成本。作者将其集成到 WeSight 中，演示了一句话将公众号文章转成小红书图文的功能，展示了 Agent 自我组合工作流的潜力。

0 人收藏 0 人点赞

#model-routing

缓存如何每月帮我们节省数百美元的AI成本

Reddit r/AI_Agents ↗ · 2026-06-10

本文介绍了通过构建智能缓存网关（Hawiyat Composer）如何利用精确匹配缓存、语义缓存、模型路由和本地路由消除重复的token浪费，从而节省大量AI API成本。

0 人收藏 0 人点赞

#model-routing

人们如何在AI代理工作流中减少token浪费？

Reddit r/AI_Agents ↗ · 2026-06-10

讨论了AI代理工作流中由于重复上下文导致的token浪费问题，介绍了一个名为Badgr-auto的开源代理用于去重，并询问社区如何应对该问题。

0 人收藏 0 人点赞

#model-routing

我尝试在智能体平台上构建了六个月。以下是我迁移到自托管技术栈的原因。

Reddit r/AI_Agents ↗ · 2026-06-10

一位开发者分享了他们在六个月后从智能体平台迁移到自托管技术栈的经验，指出了对模型选择、成本和执行隔离的更好控制，导致 Token 成本下降了 60%。

0 人收藏 0 人点赞

#model-routing

@tomas_hk: 是的，我们在此分享了我们的经验：

X AI KOLs Following ↗ · 2026-06-08 缓存

这是一份全面指南，解释了模型路由技术，该技术能够智能地为每个请求选择最合适的AI模型，以优化成本、质量和延迟。文章将模型路由与AI网关进行了对比，并强调了其在代理型AI工作负载中的重要性。

0 人收藏 0 人点赞

#model-routing

AI token 使用在什么情况下会成为业务问题？

Reddit r/AI_Agents ↗ · 2026-06-08

文章强调了AI token使用经济性在大规模应用时被低估的挑战，讨论了随着组织从概念验证转向企业级部署，成本如何成为治理问题。它提出了关于成本可见性、监控以及平衡性能与成本的问题。

0 人收藏 0 人点赞

#model-routing

@vintcessun: 白天看到这个repo有点意思。 UltraCode-Shim把Claude Code的UltraCode模式（xhigh effort+动态workflow）代理到了任意付费模型上。原理是本地跑一个纯stdlib的代理，自动加上Ultr…

X AI KOLs Timeline ↗ · 2026-06-08 缓存

UltraCode-Shim is an open-source tool that proxies Claude Code's UltraCode mode (xhigh effort + dynamic workflow) to any paid model via a local stdlib-only proxy, supporting dual-model orchestration with automatic routing by task difficulty.

0 人收藏 0 人点赞

#model-routing

@AlchainHust: https://x.com/AlchainHust/status/2062699252913221707

X AI KOLs Timeline ↗ · 2026-06-05 缓存

OpenSquilla 是一个开源、可本地运行的 AI agent，通过 MetaSkill 技术让 AI 自动组织多个技能形成工作流，并实现跨厂商智能模型路由，显著降低使用成本。

0 人收藏 0 人点赞

#model-routing

@saameeey: https://x.com/saameeey/status/2062229308878581772

X AI KOLs Timeline ↗ · 2026-06-03 缓存

本文探讨了AI产品为何需要新的「AI集成层」来处理上下文检索、工具执行、模型路由和可观测性，并引用了Merge.dev为此提供的基础设施。

0 人收藏 0 人点赞

#model-routing

@YuhuangOu: https://x.com/YuhuangOu/status/2062206333349446060

X AI KOLs Timeline ↗ · 2026-06-03 缓存

本文认为，企业级AI正从单一模型的聊天机器人转向多智能体架构，专业智能体动态路由，并从质量、成本和灵活性三方面论证了转变的必要性。

0 人收藏 0 人点赞

#model-routing

@Yuancheng: ➤ 最近还是不断有新的 Agent Harness 思路和实践在出现。这两天看到 OpenSquilla，一个开源、能本地托管的 AI Agent。 ① 它有智能模型路由——同样的任务，token 成本比 OpenClaw 省 …

X AI KOLs Timeline ↗ · 2026-06-03 缓存

OpenSquilla 是一个开源、可本地托管的 AI Agent，具有智能模型路由功能，可在不同模型间分配任务以节省 token 成本，并引入 MetaSkill 机制让 Agent 自动组织技能。

0 人收藏 0 人点赞

#model-routing

@cryptopunk7213: 这真是天才。在AI模型越来越昂贵且日益丰富的世界里，这样的产品简直是梦想中的AI护城河……

X AI KOLs Following ↗ · 2026-06-03 缓存

Factory Router 为每个任务自动选择最佳AI模型，声称能在保持前沿性能的同时削减25%的成本，对大企业来说是一款前景广阔的工具。

0 人收藏 0 人点赞

#model-routing

UniScale: 通过模型路由与测试时扩展的在线联合优化实现自适应统一推理扩展

arXiv cs.AI ↗ · 2026-06-01 缓存

提出UniScale，一种在线框架，通过上下文多臂老虎机优化统一模型路由和测试时扩展，以在LLM推理中实现更好的质量-成本权衡。

0 人收藏 0 人点赞

model-routing

提交意见反馈