归一化轨迹模型

Hugging Face Daily Papers 论文

摘要

本文介绍了归一化轨迹模型(NTM),这是一种基于扩散生成的新颖方法,它将反向步骤建模为具有精确似然训练的有条件归一化流。NTM 仅需四个步骤即可实现高质量的文本到图像生成,同时保留了似然框架,在标准基准测试中优于基线方法。

基于扩散的模型将采样分解为许多小的去噪步骤——当生成过程被压缩为少数粗略的转换时,这一假设不再成立。现有的少步方法通过蒸馏、一致性训练或对抗性目标来解决这一问题,但在此过程中牺牲了似然框架。我们引入了归一化轨迹模型(NTM),它将每个反向步骤建模为一个具有精确似然训练的表达性条件归一化流。在架构上,NTM 结合了每个步骤内的浅层可逆块以及跨轨迹的深层并行预测器,形成了一个可以从头开始训练或由预训练的流匹配模型初始化的端到端网络。其精确的轨迹似然还进一步启发了自蒸馏:在模型自身得分上训练的轻量级去噪器可在四个步骤内生成高质量样本。在文本到图像基准测试中,NTM 仅用四个采样步骤即可匹配或超越强大的图像生成基线,并独特地保留了生成轨迹上的精确似然。
查看原文
查看缓存全文

缓存时间: 2026/05/11 02:42

论文页面 - 归一化轨迹模型

来源: https://huggingface.co/papers/2605.08078

摘要

归一化轨迹模型通过一种新颖的方法改进扩散生成模型:将每一个反向步骤建模为具有精确似然训练的可表达的条件归一化流,从而在极少的步数内实现高质量样本生成的同时,保持似然框架的完整性。

基于扩散的模型 (https://huggingface.co/papers?q=Diffusion-based%20models) 将采样过程分解为许多微小的 高斯去噪步骤 (https://huggingface.co/papers?q=Gaussian%20denoising%20steps)——当生成过程被压缩为几个粗略的转换时,这一假设会失效。现有的少步生成方法通过知识蒸馏、一致性训练或对抗目标来解决这一问题,但在此过程中牺牲了似然框架。我们引入了归一化轨迹模型(NTM),它将每一个反向步骤建模为具有精确似然训练 (https://huggingface.co/papers?q=likelihood%20training) 的可表达条件归一化流。在架构上,NTM 在每个步骤中结合了浅层可逆块 (https://huggingface.co/papers?q=invertible%20blocks),并在整个轨迹上采用深层并行预测器,形成一个端到端网络,可以从头开始训练或从预训练的流匹配模型 (https://huggingface.co/papers?q=flow-matching%20models) 中初始化。其精确的轨迹似然性进一步支持了自蒸馏 (https://huggingface.co/papers?q=self-distillation):一个在模型自身分数上训练的轻量级去噪器可以在四步内生成高质量样本。在文本到图像基准测试 (https://huggingface.co/papers?q=text-to-image%20benchmarks) 中,NTM 仅用四步采样即可匹敌或超越强大的图像生成基线方法,同时独特地保留了生成轨迹上的精确似然性。

查看 arXiv 页面 (https://arxiv.org/abs/2605.08078) 查看 PDF (https://arxiv.org/pdf/2605.08078) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.08078)

在您的智能体中获取此论文:

hf papers read 2605\.08078

还没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型 0

暂无链接此论文的模型

在模型的 README.md 中引用 arxiv.org/abs/2605.08078 即可在此页面进行链接。

引用此论文的数据集 0

暂无链接此论文的数据集

在数据集的 README.md 中引用 arxiv.org/abs/2605.08078 即可在此页面进行链接。

引用此论文的应用空间 0

暂无链接此论文的应用空间

在应用空间的 README.md 中引用 arxiv.org/abs/2605.08078 即可在此页面进行链接。

包含此论文的收藏集 0

暂无包含此论文的收藏集

添加此论文至收藏集 (https://huggingface.co/new-collection) 即可在此页面进行链接。

相似文章

轨迹即师:通过能量导航蒸馏实现少步离散流匹配

Hugging Face Daily Papers

本文介绍了轨迹塑造离散流匹配(TS-DFM),该方法以引导式导航取代盲目随机跳跃,显著提升了文本生成效率并降低了计算成本。与传统多步基线相比,该方法在保持推理成本不变的同时,实现了更低的困惑度和更快的速度。

LeapAlign:通过构建两步轨迹在任意生成步骤后训练流匹配模型

Hugging Face Daily Papers

LeapAlign是一种后训练方法,通过两步轨迹捷径降低计算成本,同时实现梯度稳定传播到早期生成步骤,从而改善流匹配模型与人类偏好的对齐。在微调Flux模型时,该方法在多种图像质量和文本对齐指标上均优于现有最先进方法。