思考先于约束:面向大型语言模型的统一解码框架

Hugging Face Daily Papers 论文

摘要

提出了一种名为 In-Writing 的新型混合解码框架,该框架在触发词之后才施加约束,将自由形式推理与结构化生成相结合,从而在分类和推理任务中提升准确性。

自然生成使大型语言模型(LLMs)能够产生自由形式的答案,并具备丰富的推理能力,然而缺乏结构使得输出难以验证。相反,约束解码保证了标准化格式,但由于过早施加约束,可能无意中限制了推理能力。我们提出了一种混合方法——In-Writing,它在单次调用中结合了自由形式推理与结构化生成。模型首先进行无约束推理,只有在生成触发词后才应用结构化解码,从而明确地将推理与格式编排分离开来。我们证实,所提出的触发词策略能够几乎完全消除过早触发——即约束解码中断正在进行推理的失效模式。在涵盖分类和推理任务的多个数据集上的评估表明,相比自然生成,我们的方法在最先进水平上实现了高达27%的准确率提升。我们的代码可在以下地址获取:https://github.com/Nokia-Bell-Labs/InWriting。
查看原文
查看缓存全文

缓存时间: 2026/05/29 11:01

论文页面 - 先思考再约束:大型语言模型的统一解码框架

来源:https://huggingface.co/papers/2601.07525

摘要

本文提出了一种名为 In‑Writing 的混合方法,它将自由形式推理与结构化生成相结合,通过将约束应用延迟到触发词元生成之后,提升了分类与推理任务的准确率。

自然生成允许大型语言模型(Large Language Models,LLMs)产生带有丰富推理的自由形式回复,但缺乏结构导致输出难以验证。相反,约束解码(constrained decoding)确保了标准化的格式,却可能在生成过程中过早施加约束,从而无意中限制了推理能力。我们提出了一种混合方法 In‑Writing,它在单次调用中融合了自由形式推理(free-form reasoning)与结构化生成(structured generation)。模型首先进行无约束的推理,只有在生成触发词元(trigger token)后才应用结构化解码,从而将推理与格式明确解耦。我们证实,所提出的触发词元策略能够几乎完全消除过早触发(premature triggering)——即约束解码打断正在进行的推理的故障模式。在涵盖分类与推理任务的多个数据集上的评估表明,我们的方法相比最先进技术取得了高达 27% 的准确率提升。我们的代码可在以下地址获取:https://github.com/Nokia-Bell-Labs/InWriting。

查看 arXiv 页面(https://arxiv.org/abs/2601.07525)查看 PDF(https://arxiv.org/pdf/2601.07525)GitHub0(https://github.com/Nokia-Bell-Labs/InWriting)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2601.07525)

在你的 Agent 中获取此论文:

hf papers read 2601.07525

没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

没有链接此论文的模型

在模型 README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。

引用此论文的数据集0

没有链接此论文的数据集

在数据集 README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。

引用此论文的 Space0

没有链接此论文的 Space

在 Space README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。

包含此论文的收藏集0

没有包含此论文的收藏集

将此论文添加到一个收藏集(https://huggingface.co/new-collection)中以从该页面链接。

相似文章

大型学习模型中增强且高效的推理

arXiv cs.AI

本文提出了一种改进大型语言模型推理的方法,通过重新编码数据以显式表示关系,实现高效且原则性的推理,并具备关系规则的多项式时间可学习性,从而解决幻觉问题并支持跨多次调用的可靠推理。

学习如何让大语言模型进行推理

OpenAI Blog

OpenAI 发布了一篇文章,通过密码破译示例探索大语言模型的推理技术,展示了语言模型的逐步问题求解和模式识别能力。