@omarsar0: // Scaling Laws for Agent Harnesses // 如果你构建代理框架,这篇文章值得一看。(收藏)大多数 harness…
摘要
关于代理框架缩放定律的新研究显示,大多数字令和工具调用次数并不重要;该研究引入了一种有效的方法。
// Scaling Laws for Agent Harnesses //
如果你构建代理框架,这篇文章值得一看。
(收藏)
大多数框架调优将每个令牌和工具调用视为数量决定一切。新研究表明,其中大部分并不重要。
该研究引入了有效的方法 https://t.co/SDT2ZVUuuW
查看缓存全文
缓存时间: 2026/05/30 02:01
// 智能体框架的缩放定律 //
如果你构建智能体框架,这篇文章值得一读。
(收藏它)
大多数框架调优将每个 token 和工具调用视为数量至上。新研究表明,大多数情况并非如此。
这项工作引入了 Effective https://t.co/SDT2ZVUuuW
相似文章
@Xudong07452910: 这篇最新的论文 Scaling Laws for Agent Harnesses 很适合做 Agent Harness 的人看。 它讲了一个很关键的点:Agent 不是靠多跑 token、多调工具、多循环几轮就一定变强。真正重要的是,这些…
这篇论文提出了 Effective Feedback Compute (EFC) 作为衡量 Agent Harness 性能的缩放坐标,强调有效反馈比原始计算量更重要,对 Agent 系统设计有重要启示。
从模型扩展到系统扩展:在自主AI中扩展架构框架
本文认为,推进自主AI需要扩展围绕基础模型的系统架构,重点关注可审计、模块化和可验证的组件。作者介绍了参考架构框架CheetahClaws,并概述了上下文管理、可信内存和动态技能路由方面的瓶颈。
@dair_ai: // 状态外部化框架 // 关于如何有效构建代理和框架的一种新范式正在兴起。如果……
Harness-1 引入了一种状态外部化框架,将常规记账与搜索代理中的策略决策分离,使一个 20B 模型在多个基准测试中超越更大的前沿搜索器。
@omarsar0: // 适配接口,而非模型 // 我对我的廉价模型加优质harness构建的结果感到着迷…
提出了Life-Harness,一种通过适配运行时接口而非模型权重来改进冻结的LLM智能体的方法,在126个设置和18个backbones中实现了平均88.5%的相对改进。
@dair_ai: 系统规模扩展是智能体AI的下一个真正瓶颈。如果你构建智能体编排层,这是一张清晰的地图…
本文认为,智能体AI的下一个瓶颈是系统规模扩展(围绕基础模型设计“框架”),而不仅仅是模型规模扩展,并介绍了CheetahClaws(一个Python原生参考框架),以及对三个核心瓶颈的分析:上下文治理、可信内存和动态技能路由。