distribution-shift

标签

Cards List
#distribution-shift

基准审计中的可靠性差距:分布偏移与规模作为污染检测的失效模式

arXiv cs.AI · 19小时前 缓存

本文识别出分布偏移和规模约束是LLM基准审计中统计污染检测方法的关键失效模式。对27个模型评估三种范式的结果显示,在335次评估中仅有199次正确结果,表明存在系统性可靠性差距,使得这些方法无法替代透明数据溯源。

0 人收藏 0 人点赞
#distribution-shift

分布漂移下泛化边界中的体制到达不确定性

arXiv cs.LG · 19小时前 缓存

本文提出一个理论框架,用于量化当训练分布与部署分布因潜在体制动态(建模为马尔可夫切换过程)不同时的部署风险,提供了精确分解和有限样本边界。

0 人收藏 0 人点赞
#distribution-shift

TASER:面向几何驱动鲁棒性的任务感知Stein正则化

arXiv cs.LG · 2天前 缓存

介绍了TASER,一种从Langevin Stein算子导出的训练时正则化框架,它鼓励预测器与数据密度之间的几何兼容性,提高了CIFAR-10上的对抗鲁棒性和稳定性,而不会显著降低干净准确率。

0 人收藏 0 人点赞
#distribution-shift

从静态上下文到校准的交互式强化学习:通过对齐模拟器缓解多轮对话中的分布偏移

arXiv cs.AI · 2026-05-27 缓存

本文从理论上识别并缓解了多轮对话强化学习中的上下文分布偏移,提出了校准交互式RL,该框架将交互式RL与模拟器对齐相结合,以减少模拟到真实的差距并实现最先进的性能。

0 人收藏 0 人点赞
#distribution-shift

MARGIN:多智能体基础模型协调中的运行时置信度校准

arXiv cs.LG · 2026-05-25 缓存

MARGIN 是一种用于多智能体基础模型系统的运行时置信度校准方法,它在线学习每个智能体的校准因子,将硬基准上的成对分辨率从低于随机水平提升至70-89%,且无需保留数据或重新训练。

0 人收藏 0 人点赞
#distribution-shift

MMD球作为信度集:测试时自适应中认知不确定性的PAC-贝叶斯框架

arXiv cs.LG · 2026-05-22 缓存

本文开发了一种用于测试时自适应的PAC-贝叶斯框架,该框架使用MMD球作为信度集,提供了形式化的泛化界,并在分布偏移下区分认知不确定性与偶然不确定性。

0 人收藏 0 人点赞
#distribution-shift

PIMSM: 物理信息驱动的多尺度Mamba:分布偏移下稳定的神经表示

arXiv cs.LG · 2026-05-19 缓存

本文提出物理信息驱动的多尺度Mamba(PIMSM),这是一种状态空间架构,它将模型记忆与物理时间尺度对齐,以提升在科学时间序列分布偏移下的鲁棒性,并在fMRI和天气预报任务上展示了改进。

0 人收藏 0 人点赞
#distribution-shift

ICRL:通过强化学习内化自我批判

arXiv cs.AI · 2026-05-18 缓存

本文介绍了ICRL框架,该框架联合训练求解器和批判器,通过强化学习内化批判指导,使求解器无需外部批判即可自我改进。它使用分布校准和角色分组优势估计,在智能体和数学推理任务上比GRPO提高了6-7个点。

0 人收藏 0 人点赞
#distribution-shift

当非正式文本导致自然语言推理失效:分词失败、分布偏移及针对性缓解策略

arXiv cs.CL · 2026-04-21 缓存

# 分词失败、分布偏移及针对性缓解策略 来源:[https://arxiv.org/html/2604.16787](https://arxiv.org/html/2604.16787) ## 当非正式文本导致自然语言推理失效:分词失败、分布偏移及针对性缓解策略 ###### 摘要 我们研究了在将四种转换操作应用于 SNLI 和 MultiNLI 时,非正式表层形式如何降低 ELECTRA-small(14M)和 RoBERTa-large(355M)的自然语言推理准确率:俚语替换、表情符号替换、Gen-Z 填充词,以及它们的

0 人收藏 0 人点赞
#distribution-shift

超越表面统计:通过内部表示实现LLM鲁棒共形预测

arXiv cs.CL · 2026-04-20 缓存

本论文提出了一个利用内部表示而非输出层统计的LLM共形预测框架,引入层级信息(LI)评分作为非一致性度量,在分布偏移下改进有效性-效率权衡。该方法在QA基准上相比文本级基线展现出更强的对校准-部署不匹配的鲁棒性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈