decoding-strategy

标签

Cards List
#decoding-strategy

解码阶段间歇性注入随机 token 可在无需微调的情况下提升 LLM 多样性

Reddit r/ArtificialInteligence · 2天前

哈佛大学的一篇研究论文提出了 Recoding-Decoding (RD),这是一种新型解码方案,通过注入随机引导短语和偏转 token 来挖掘 LLM 的长尾知识,在无需微调的情况下显著提升输出多样性。该方法在保持高相关性的同时缓解了回复同质化问题,且模型能力越强,多样性提升越明显。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈