思考先于约束:面向大型语言模型的统一解码框架
摘要
提出了一种名为 In-Writing 的新型混合解码框架,该框架在触发词之后才施加约束,将自由形式推理与结构化生成相结合,从而在分类和推理任务中提升准确性。
查看缓存全文
缓存时间: 2026/05/29 11:01
论文页面 - 先思考再约束:大型语言模型的统一解码框架
来源:https://huggingface.co/papers/2601.07525
摘要
本文提出了一种名为 In‑Writing 的混合方法,它将自由形式推理与结构化生成相结合,通过将约束应用延迟到触发词元生成之后,提升了分类与推理任务的准确率。
自然生成允许大型语言模型(Large Language Models,LLMs)产生带有丰富推理的自由形式回复,但缺乏结构导致输出难以验证。相反,约束解码(constrained decoding)确保了标准化的格式,却可能在生成过程中过早施加约束,从而无意中限制了推理能力。我们提出了一种混合方法 In‑Writing,它在单次调用中融合了自由形式推理(free-form reasoning)与结构化生成(structured generation)。模型首先进行无约束的推理,只有在生成触发词元(trigger token)后才应用结构化解码,从而将推理与格式明确解耦。我们证实,所提出的触发词元策略能够几乎完全消除过早触发(premature triggering)——即约束解码打断正在进行的推理的故障模式。在涵盖分类与推理任务的多个数据集上的评估表明,我们的方法相比最先进技术取得了高达 27% 的准确率提升。我们的代码可在以下地址获取:https://github.com/Nokia-Bell-Labs/InWriting。
查看 arXiv 页面(https://arxiv.org/abs/2601.07525)查看 PDF(https://arxiv.org/pdf/2601.07525)GitHub0(https://github.com/Nokia-Bell-Labs/InWriting)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2601.07525)
在你的 Agent 中获取此论文:
hf papers read 2601.07525
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
没有链接此论文的模型
在模型 README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。
引用此论文的数据集0
没有链接此论文的数据集
在数据集 README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。
引用此论文的 Space0
没有链接此论文的 Space
在 Space README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。
包含此论文的收藏集0
没有包含此论文的收藏集
将此论文添加到一个收藏集(https://huggingface.co/new-collection)中以从该页面链接。
相似文章
大型学习模型中增强且高效的推理
本文提出了一种改进大型语言模型推理的方法,通过重新编码数据以显式表示关系,实现高效且原则性的推理,并具备关系规则的多项式时间可学习性,从而解决幻觉问题并支持跨多次调用的可靠推理。
COFT:面向大型语言模型公平思维链推理的反事实-共形解码
COFT是一种无需训练的解码方法,通过应用令牌级公平控制和共形校准来减少大型语言模型思维链推理中的偏见,以最小的计算开销实现30-55%的偏见降低。
揭示大语言模型中的数学推理:内部机制的方法学研究
本文通过早期解码分析大语言模型的内部机制,研究其如何执行算术运算。研究发现,能力强的模型在推理任务中,注意力模块和 MLP 模块之间呈现明确的分工。
指令层级失效之处:诊断与修复推理语言模型中的故障
本文引入了一个白盒诊断框架,将推理语言模型中的指令层级故障定位为识别、冲突解决和响应实现三个阶段。该框架评估了多个模型,并提出了两种无需训练的自我监控机制,可将违规率降低81%–99%。
学习如何让大语言模型进行推理
OpenAI 发布了一篇文章,通过密码破译示例探索大语言模型的推理技术,展示了语言模型的逐步问题求解和模式识别能力。