product-of-experts

标签

Cards List
#product-of-experts

用于扩散世界模型的记忆专家组合

arXiv cs.LG · 2026-05-20 缓存

一种新的基于扩散的世界模型框架,利用专门记忆专家(短期、长期情境和空间)的组合,实现更好的时间一致性和长上下文建模,且无二次成本。

0 人收藏 0 人点赞
#product-of-experts

专家乘积训练减少自然语言推理中的数据集伪影

arXiv cs.CL · 2026-04-22 缓存

# 专家乘积训练减少自然语言推理中的数据集伪影 来源:[https://arxiv.org/html/2604.19069](https://arxiv.org/html/2604.19069) ###### 摘要 神经NLI模型过度拟合数据集伪影而非真正推理。仅假设模型在SNLI上达到57.7%,显示出强烈虚假关联,其中38.6%的基线错误源于这些伪影。作者提出专家乘积(PoE)训练,对偏见模型过度自信的样本降权。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈