product-of-experts

#product-of-experts

用于扩散世界模型的记忆专家组合

arXiv cs.LG ↗ · 2026-05-20 缓存

一种新的基于扩散的世界模型框架，利用专门记忆专家（短期、长期情境和空间）的组合，实现更好的时间一致性和长上下文建模，且无二次成本。

0 人收藏 0 人点赞

#product-of-experts

# 专家乘积训练减少自然语言推理中的数据集伪影来源：[https://arxiv.org/html/2604.19069](https://arxiv.org/html/2604.19069) ###### 摘要神经NLI模型过度拟合数据集伪影而非真正推理。仅假设模型在SNLI上达到57.7%，显示出强烈虚假关联，其中38.6%的基线错误源于这些伪影。作者提出专家乘积（PoE）训练，对偏见模型过度自信的样本降权。

0 人收藏 0 人点赞

product-of-experts

用于扩散世界模型的记忆专家组合

专家乘积训练减少自然语言推理中的数据集伪影

提交意见反馈