format-constrained-generation

标签

Cards List
#format-constrained-generation

扩散大语言模型中面向格式约束生成的动态填充锚点

arXiv cs.CL · 2026-06-04 缓存

本文提出了动态填充锚点(DIA),一种适用于扩散大语言模型的免训练方法。该方法通过动态估计终止锚点位置来强制执行格式约束(如可解析的 JSON、推理模板),同时避免了固定跨度方法的僵硬性。实验表明,DIA 在 GSM8K 和 MATH 基准测试上取得了显著的零样本性能提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈