我以为是模型问题的代理bug,结果出在框架上

Reddit r/AI_Agents 新闻

摘要

作者分享了一次调试经历:代理循环是由框架截断工具输出导致的,而非模型故障,突显了代理基础设施相比模型存在的可靠性差距。

花了三天时间调试一个代理,它反复调用同一个网络搜索工具。第一时间想到的是模型无法处理架构。从Sonnet换成Opus,再换成GPT-5。同样是循环。换了框架。循环不同,但模式相同。最终追踪到问题在于框架在工具输出超过默认token预算时静默截断。工具返回了一个很长的JSON数据块,框架在响应中途将其截断,模型看到似乎是未完成的答案,于是不断再次调用工具。截断操作没有在任何地方记录。追踪只显示调用发出和部分响应返回。在当今这个时代(接近2026年中),模型几乎从来不是工具可靠性的瓶颈。框架层才是。有很多关于模型工具调用的排行榜,但没有哪个框架能最可靠地处理实际工具I/O的排行榜。大家实际部署的最可靠的框架是什么?
查看原文

相似文章