INSIGHTS: 基于示范的时间序列预测摘要
摘要
INSIGHTS 是一种模型无关的方法,通过生成多样化、信息丰富的样本摘要来提供时间序列模型的全局解释,这些摘要捕捉特定领域的行为,在用户研究中优于局部归因方法。
arXiv:2605.18849v1 公告类型:新
摘要:可解释性方法发展迅速,但时间序列模型的全局解释仍不完善,大多数方法侧重于局部、实例级别的归因。我们提出了INSIGHTS,一种模型无关、以用户为中心的全局解释方法,用于时间序列模型。我们的方法在设计上优先考虑简单性、效率和透明度,确保利益相关者能够轻松采用其输出。虽然当前方法侧重于局部解释,但INSIGHTS生成样本摘要,提供模型行为的全面概述。它平衡时间序列样本的重要性和多样性,通过使用捕捉时间序列行为特定领域方面(如超出领域规范)的效用函数来创建信息子集。我们通过实验、访谈和用户研究评估INSIGHTS。结果表明,INSIGHTS能够有效构建全面、多样化的时间序列子集,生成适合个人评估的摘要。领域专家更偏好它,因为它能提供对模型行为的稳定理解以及所识别样本的质量。此外,接受INSIGHTS摘要的用户研究参与者对模型整体行为的理解有所增强。
相似文章
从数据到洞察:探索程序思维提示在图表摘要中的应用
本文介绍了一种基于程序思维提示(Program-of-Thoughts prompting)的零样本图表摘要策略,其中轻量级视觉语言模型(VLMs)生成Python程序来计算统计数据,从而在事实准确性上优于现有方法。
预测性数据调试:在训练前揭示并塑造模型所学(11分钟阅读)
这项研究介绍了一种方法,利用可解释性在训练前预测DPO将从偏好数据集中放大或抑制哪些行为,从而实现数据调试以防止不良影响。该技术达到了R²=0.9的预测准确率,并集成到了Goodfire的Silico平台中。
超越整体模型:深度多元时间序列预测的系统组件级基准测试
本文介绍了TSCOMP,一个大规模基准测试,系统地将深度多元时间序列预测方法分解为细粒度组件,以实现自动化模型选择,性能优于复杂的整体架构。
使用语法与语义上下文评估汇总(SSAS)的情感预测一致性分析
本论文提出了SSAS(语法与语义上下文评估汇总)框架,旨在通过分层分类和迭代汇总来减少噪声和方差,提高基于大语言模型的情感预测的一致性。在三个行业标准数据集上的实证评估显示,数据质量和企业决策可靠性可提升30%。
SCURank:利用摘要内容单元对多个候选摘要进行排序,提升摘要质量
SCURank 引入“摘要内容单元”对候选摘要打分,使从多个大模型蒸馏出的小模型超越传统指标与单一模型蒸馏效果。