标签
本文研究Engram模块(一种关联记忆机制)在自回归图像生成中是提供内容可寻址检索,还是仅作为门控架构的侧通路。
本文提出对齐潜在几何以实现球形流匹配,将潜在变量投影到固定半径的球面上,并使用球形线性插值来提升图像生成质量,在类条件ImageNet上持续改进FID。