标签
LEAF是一个用于评估大语言模型在事件增强预测任务(如未来事件概率和时间序列预测)上的实时基准。它采用递归检索代理系统结合双代理交叉验证来提供相关的辅助文本,并表明大语言模型能够利用复杂事件来提升预测性能。