标签
本文是系列文章第六篇,详细解释了subagent的概念、工作原理及其在coding agent中的作用,包括tool call和runtime机制,以及不同subagent类型(fresh child、forked child、partial fork)的适用场景。
GLM-5.2 使用一种技术来对抗奖励作弊,即通过检测并阻止可疑的工具调用,而不是惩罚模型,从而避免其他方法中常见的混淆问题。
OKed 是一个 OpenClaw 插件,拦截风险性工具调用并在执行前需要用户批准,防止代理执行删除数据或发送付款等破坏性操作。
用户报告在使用 qwen3.6-27b 时遇到无限工具调用循环,尽管调整了 temperature 和 top-k 等参数。
这篇文章质疑为什么量化基准测试只关注困惑度和散文质量,而不考虑工具调用有效性,认为结构化输出由于有效token延续更少而更早退化,这可能会误导从业者对可用于智能体场景的量化级别的判断。