标签
本文对自动化提示优化进行了基于因果启发的分析,涵盖多种框架、大语言模型和任务,识别出特定编辑类型(如复杂度增加型、元指令型)根据任务特征具有系统的负面或正面效应,从而解释了泛化失败的原因。
介绍了反思式提示调优(RPT),一种利用LLM函数调用,基于系统性错误模式迭代诊断和修改提示的框架,从而提升推理任务性能和校准能力。