weight-transfer

#weight-transfer

Linearizing Vision Transformer with Test-Time Training

Hugging Face Daily Papers ↗ · 2026-05-28 Cached

This paper proposes a method to convert pretrained Softmax attention models into linear-complexity Test-Time Training (TTT) architectures, achieving comparable text-to-image quality to fine-tuned Softmax models while significantly accelerating inference. The approach is validated by linearizing Stable Diffusion 3.5, resulting in SD3.5-T^5 with 1.32x speedup at 1K resolution.

0 favorites 0 likes

weight-transfer

Linearizing Vision Transformer with Test-Time Training

Submit Feedback