标签
IDEAL提出了一种用于离散表示自编码的深度对齐框架,联合对齐量化令牌与浅层和深层VFM特征,以实现卓越的重建和生成性能。
DecQ引入了轻量级的细节凝缩查询,以改进表示自编码器中的重建与生成,同时不破坏预训练的语义空间。
本文提出了一种新的用于线性逆问题的基于能量的模型,该模型学习归一化后验密度,克服了扩散模型的局限性。它实现了无偏采样、自适应采样和盲退化估计,在ImageNet、CelebA和AFHQ上具有竞争力的性能。
Qwen-Image-VAE-2.0 是一个高压缩变分自编码器套件,通过增强的架构、大规模训练和语义对齐策略,提升了重建保真度和可扩散性。
Elon Musk 解释说,Tesla FSD 利用 AI 光子计数重建技术而非标准 RGB,从而在低光照和强眩光条件下实现更卓越的性能。