attribution-methods

标签

Cards List
#attribution-methods

GRALIS:通过里斯表示定理实现线性归因方法的统一规范框架

arXiv cs.LG · 2026-05-08 缓存

这篇 arXiv 预印本介绍了 GRALIS,这是一个利用里斯表示定理(Riesz Representation Theory)来形式化和比较 SHAP、LIME 及积分梯度(Integrated Gradients)等线性归因方法的统一数学框架。

0 人收藏 0 人点赞
#attribution-methods

TPA: 用于检测RAG中幻觉的下一个令牌概率归因

arXiv cs.CL · 2026-04-20 缓存

TPA提出了一种新颖的方法,通过将下一个令牌概率归因于七个不同的源头(查询、RAG上下文、过去令牌、自身令牌、FFN、最终LayerNorm、初始嵌入),并按词性标签聚合,来检测RAG系统中的幻觉。该方法在包括Llama2、Llama3、Mistral和Qwen在内的五个大语言模型上实现了最先进的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈