标签
本文介绍了解释质量标记(EQMs),这是一组由大语言模型评分的60种推理模式,用于衡量预测锦标赛中自然语言解释的质量。通过分析超过55,000个预测-理由配对,EQMs在预测层面和预测者层面都预测了准确性,优于之前的方法。
Otter Weather 是一种计算高效的中期天气预报AI模型,其性能优于数值天气预报基线和前沿AI模型,同时显著减少训练计算量,旨在普及高性能天气预报。
本文提出了面向时间序列基础模型的状态分层评估方法,揭示出聚合指标会掩盖交通状态转换期间的严重失败,并提出了双峰混合增强方法,在保持整体准确性的同时改善覆盖范围。
SAGA引入了一种仅解码器变压器,用于终身收入的多步概率预测,并配合自适应共形预测提供可靠的预测区间。基于大型瑞典注册数据集训练,相较于传统参数模型和基线模型取得了显著改进。