token-level

#token-level

ARCA：令牌信号退化时的适配器残差信用分配

arXiv cs.LG ↗ · 2天前缓存

本文指出了在使用LoRA进行LLM强化学习时，令牌级信用分配中存在的一种结构性失效模式，即内在信号退化。它提出了适配器残差信用分配（ARCA），该方法从适配器的隐藏状态残差中推导令牌显著性，并与基线方法保持竞争力。

0 人收藏 0 人点赞

#token-level

RAGognizer：通过检测头集成实现幻觉感知微调

arXiv cs.CL ↗ · 2026-04-20 缓存

RAGognizer 提出了一种幻觉感知微调方法，该方法将轻量级检测头集成到大语言模型（LLMs）中，以实现语言建模与幻觉检测的联合优化，适用于 RAG 系统。论文介绍了 RAGognize，一个包含自然发生的闭域幻觉及其词元级标注的数据集，并展示了在降低幻觉率的同时，实现了最先进的幻觉检测性能，且不损害语言质量。

0 人收藏 0 人点赞

token-level

ARCA：令牌信号退化时的适配器残差信用分配

RAGognizer：通过检测头集成实现幻觉感知微调

提交意见反馈