标签
本文介绍了 Insights Generator,一个用于 LLM 智能体系统性语料级轨迹诊断的多智能体系统。它通过在执行轨迹中提出并测试假设,生成有证据支撑的洞察。实验表明,使用 Insights Generator 报告可使脚手架性能提升 30.4 个百分点。