标签
本文从理论上分析了课程学习通过将复杂问题分解为更简单的子问题并组合解决方案,如何显著降低学习模拟顺序计算(半自动机)的样本复杂度——相较于直接方法,在监督微调中实现次多项式监督需求,并在可验证奖励的强化学习中实现指数级更弱的覆盖条件。
本文形式化了‘组合行为泄漏’(CBL),这是提示组合型智能体系统中的一种故障模式:由于Transformer自注意力机制缺乏模块级隔离,编辑一个提示模块会静默改变其他模块的行为。本文提出了一个可操作的定义、一个可复用的三通道协议,以及在Claude Sonnet 4.6智能体上进行的144次试验的实证证据,发现了亚阈值干扰,这种干扰可能在数千个决策中累积。
本文提出对抗性概念搜索(Adversarial Concept Search),一种利用大型语言模型表示几何来预测组合性失败的方法,无需评估特定输入。该方法通过测量显著特征之间的干扰来识别高风险场景。