思考先于约束：面向大型语言模型的统一解码框架

Hugging Face Daily Papers 2026/05/28 00:00 论文

llm decoding reasoning constrained-decoding structured-generation trigger-token

摘要

提出了一种名为 In-Writing 的新型混合解码框架，该框架在触发词之后才施加约束，将自由形式推理与结构化生成相结合，从而在分类和推理任务中提升准确性。

自然生成使大型语言模型（LLMs）能够产生自由形式的答案，并具备丰富的推理能力，然而缺乏结构使得输出难以验证。相反，约束解码保证了标准化格式，但由于过早施加约束，可能无意中限制了推理能力。我们提出了一种混合方法——In-Writing，它在单次调用中结合了自由形式推理与结构化生成。模型首先进行无约束推理，只有在生成触发词后才应用结构化解码，从而明确地将推理与格式编排分离开来。我们证实，所提出的触发词策略能够几乎完全消除过早触发——即约束解码中断正在进行推理的失效模式。在涵盖分类和推理任务的多个数据集上的评估表明，相比自然生成，我们的方法在最先进水平上实现了高达27%的准确率提升。我们的代码可在以下地址获取：https://github.com/Nokia-Bell-Labs/InWriting。

查看原文

查看缓存全文

缓存时间: 2026/05/29 11:01

论文页面 - 先思考再约束：大型语言模型的统一解码框架

来源：https://huggingface.co/papers/2601.07525

摘要

本文提出了一种名为 In‑Writing 的混合方法，它将自由形式推理与结构化生成相结合，通过将约束应用延迟到触发词元生成之后，提升了分类与推理任务的准确率。

自然生成允许大型语言模型（Large Language Models，LLMs）产生带有丰富推理的自由形式回复，但缺乏结构导致输出难以验证。相反，约束解码（constrained decoding）确保了标准化的格式，却可能在生成过程中过早施加约束，从而无意中限制了推理能力。我们提出了一种混合方法 In‑Writing，它在单次调用中融合了自由形式推理（free-form reasoning）与结构化生成（structured generation）。模型首先进行无约束的推理，只有在生成触发词元（trigger token）后才应用结构化解码，从而将推理与格式明确解耦。我们证实，所提出的触发词元策略能够几乎完全消除过早触发（premature triggering）——即约束解码打断正在进行的推理的故障模式。在涵盖分类与推理任务的多个数据集上的评估表明，我们的方法相比最先进技术取得了高达 27% 的准确率提升。我们的代码可在以下地址获取：https://github.com/Nokia-Bell-Labs/InWriting。

查看 arXiv 页面（https://arxiv.org/abs/2601.07525）查看 PDF（https://arxiv.org/pdf/2601.07525）GitHub0（https://github.com/Nokia-Bell-Labs/InWriting）添加到收藏集（https://huggingface.co/login?next=%2Fpapers%2F2601.07525）

在你的 Agent 中获取此论文：

hf papers read 2601.07525

没有最新的 CLI？curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

没有链接此论文的模型

在模型 README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。

引用此论文的数据集0

没有链接此论文的数据集

在数据集 README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。

引用此论文的 Space0

没有链接此论文的 Space

在 Space README.md 中引用 arxiv.org/abs/2601.07525 以从该页面链接。

包含此论文的收藏集0

没有包含此论文的收藏集

将此论文添加到一个收藏集（https://huggingface.co/new-collection）中以从该页面链接。

思考先于约束：面向大型语言模型的统一解码框架

论文页面 - 先思考再约束：大型语言模型的统一解码框架

摘要

引用此论文的模型0

引用此论文的数据集0

引用此论文的 Space0

包含此论文的收藏集0

相似文章

大规模下的Hidden Decoding: 大型语言模型的潜在计算扩展

大型学习模型中增强且高效的推理

COFT：面向大型语言模型公平思维链推理的反事实-共形解码

更深并不总是更好：通过置信层解码缓解对齐损失

无需重新训练的跨方言泛化：面向MLIR的基于模式约束解码的基准与评估

提交意见反馈