标签
Parallel Rollout Approximation (PRA) 通过使用低维中间状态和并行训练改进了像素空间自回归图像生成,在ImageNet-1K生成任务上取得了新的最先进结果。
一种名为频谱强制(Spectral Forcing)的新技术,将时间条件化的二维离散余弦变换(2D-DCT)低通算子应用于像素空间扩散模型,通过显式分离信号与噪声提升效率,在ImageNet及文生图任务上超越基线方法。
AsymFlow是斯坦福大学提出的一种新方法,它将潜在扩散模型转换为像素空间,通过避免压缩带来的信息损失,生成更逼真的图像。在基准测试中,它以更低的计算成本超越了FLUX.2 klein。
非对称流建模(AsymFlow)将噪声预测限制在低秩子空间,以实现高效的高维流生成,通过从潜在流模型微调,在ImageNet和文本到图像任务上取得了最先进的结果。
L2P 论文提出了一种潜在空间到像素空间(Latent-to-Pixel)的迁移范式,该范式利用预训练的潜在扩散模型(LDM),以极低的训练开销构建高效的像素空间模型,并实现 4K 分辨率生成。