feature-attribution

标签

Cards List
#feature-attribution

归因合同:生成式语言模型中的特征归因

arXiv cs.LG · 2026-05-25 缓存

本文介绍了归因合同(Attribution Contract),这是生成式语言模型中特征归因声明的一种规范,解决了特征定义不清以及归因方法评估方式模糊的问题。论文以自回归模型和扩散模型为例,展示了归因何时具有信息量,何时可能产生误导。

0 人收藏 0 人点赞
#feature-attribution

归因不可能性:共线性下无特征排名可同时保证忠实性、稳定性和完备性

arXiv cs.LG · 2026-05-22 缓存

本文证明,在共线性条件下,没有任何特征排名能同时满足忠实性、稳定性和完备性,刻画了完整的归因设计空间,并提供了一个形式化验证的可解释AI不可能性定理。

0 人收藏 0 人点赞
#feature-attribution

模型无关的灵敏度近似器 [P]

Reddit r/MachineLearning · 2026-05-18

一位16岁的开发者创建了sage-explainer,这是一个Python包,用于近似黑盒模型(如随机森林和XGBoost)对特征的预测灵敏度,提供比中心有限差分更稳定的结果。

0 人收藏 0 人点赞
#feature-attribution

从权重扰动到特征归因:解释全连接神经网络

arXiv cs.LG · 2026-05-18 缓存

提出一种基于权重扰动的特征归因方法(XWP和XWPc),用于全连接神经网络,在标准基线指标上取得了有竞争力的性能。

0 人收藏 0 人点赞
#feature-attribution

剪枝、解释与评估:一种基于特征归因的跨层转码器原生高效电路发现框架

arXiv cs.CL · 2026-04-21 缓存

研究人员推出了 PIE,这是一种面向跨层转码器(CLT)的原生框架,通过基于特征归因的剪枝技术实现高效的电路发现。该方法在特征选择上实现了约 40 倍的压缩,同时成功保持了 IOI 和 Doc-String 任务的行为保真度。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈