mode-collapse

标签

Cards List
#mode-collapse

Pigeonholing:不良提示导致模型崩溃并犯错

arXiv cs.CL · 9小时前 缓存

本文介绍了“Pigeonholing”这一现象,即不良提示导致大语言模型崩溃并重复错误,造成38-40%的性能下降。跨越10个任务和10个模型的实验表明,随着对话轮次增加,问题恶化,并提出了结合合成错误的RLVR作为缓解措施。

0 人收藏 0 人点赞
#mode-collapse

灯塔里的埃利亚斯,又是?诊断LLM故事的低多样性

arXiv cs.CL · 2026-05-27 缓存

本文诊断了LLM生成故事的低多样性问题,发现88.3%的采样故事包含11个常见词汇之一(例如埃利亚斯、灯塔),且这些词汇在不同模型间普遍存在,并将这种同质性归因于后训练数据和对齐,而非预训练数据中的普遍存在。

0 人收藏 0 人点赞
#mode-collapse

超越模式崩溃:面向多样化推理的分布匹配

arXiv cs.AI · 2026-05-20 缓存

本文识别了同策略强化学习方法(如GRPO)中的模式崩溃问题,并提出了DMPO,该方法通过近似前向KL散度最小化来保持解的多样性。在NP难组合优化和数学推理任务上取得了显著改进。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈