@gneubig: 我们发现这种 "sidekick" 架构在降低LLM成本方面非常有效，因为它允许你...

X AI KOLs Following 2026/06/29 23:31 工具

sidekick-architecture llm-cost openhands developer-tools ai-agents hybrid-model

摘要

Graham Neubig 分享了一种通过将简单任务委托给较小的智能体来降低LLM成本的 sidekick 架构，并提供了一个使用 OpenHands SDK 的200行示例。这种方法也被用于 Cognition 的 Devin Fusion 混合模型 harness。

我们发现这种 "sidekick" 架构在降低LLM成本方面非常有效，因为它允许你进行上下文控制，而无需在简单任务上花费昂贵的 token。这里有一个使用 OpenHands SDK 的200行示例 :) https://gist.github.com/neubig/412ab8df8e6fd0b2bdf10602d77f9d86…

查看原文

查看缓存全文

缓存时间: 2026/06/30 07:41

我们发现这种“副手”架构在削减LLM开销方面非常有效，因为它允许你进行上下文控制，避免在简单任务上花费昂贵的token。这是一个使用OpenHands SDK的200行示例：https://gist.github.com/neubig/412ab8df8e6fd0b2bdf10602d77f9d86…

Cognition (@cognition): Devin Fusion 使用了一种围绕两个理念构建的混合模型框架：

首先，一个“副手”代理：一个较小的代理与前沿代理并行运行。前沿代理委派任务、监控进度，并保留对规划、处理歧义和最终审查的掌控权。

这使得

@gneubig: 我们发现这种 "sidekick" 架构在降低LLM成本方面非常有效，因为它允许你...

相似文章

超越LLM：为何可扩展的企业AI落地依赖于Agent逻辑

@DailyDoseOfDS_: 一个受框架控制的LLM智能体，清晰解释！大多数人认为这是一个模型加上附加工具。真正的架构…

上下文、推理与层次结构：对抗性POMDP中复合LLM智能体设计的成本-性能研究

我构建了一个开源代理，其推理核心融合了多个LLM（面板、裁判、合成器），而不是路由到单一模型

小型LLM架构：Raven Agent（本地RTX5080）+ Trinity Cortex（7B/13B/MoE在线）

提交意见反馈