decoding-strategy

#decoding-strategy

更深并不总是更好：通过置信层解码缓解对齐损失

Hugging Face Daily Papers ↗ · 2026-06-20 缓存

本文介绍了一种无需训练的编码策略——Confident Decoding，它利用熵引导搜索动态选择LLM中最可靠的中间层，从而缓解对齐损失，并在GPQA-Diamond、Omni-MATH等基准测试中提升了推理性能，且开销可忽略不计。

0 人收藏 0 人点赞

#decoding-strategy

arXiv cs.AI ↗ · 2026-06-10 缓存

该论文将对比解码推广到一种冲突感知范式，该范式在外部上下文和参数先验之间动态分配权威，提出了TriState-Bench评估协议，并引入了自适应机制路由（ARR）来解决修正与抵抗之间的不对称性。

0 人收藏 0 人点赞

#decoding-strategy

arXiv cs.LG ↗ · 2026-06-10 缓存

本文介绍了MGAP，一种无需训练的解码方法，通过自适应地仅抑制语言先验中的有害部分，同时保留模型的语义流形，从而减少多模态大语言模型中的幻觉。该方法在POPE和CHAIR基准测试上优于先前的基线方法。

0 人收藏 0 人点赞

#decoding-strategy

Reddit r/ArtificialInteligence ↗ · 2026-05-11

哈佛大学的一篇研究论文提出了 Recoding-Decoding (RD)，这是一种新型解码方案，通过注入随机引导短语和偏转 token 来挖掘 LLM 的长尾知识，在无需微调的情况下显著提升输出多样性。该方法在保持高相关性的同时缓解了回复同质化问题，且模型能力越强，多样性提升越明显。

0 人收藏 0 人点赞