visual-tokenization

#visual-tokenization

InsightTok: Improving Text and Face Fidelity in Discrete Tokenization for Autoregressive Image Generation

Hugging Face Daily Papers ↗ · 2026-05-14 Cached

InsightTok introduces content-aware perceptual losses to improve discrete visual tokenization for better text and face reconstruction, enhancing autoregressive image generation quality.

0 favorites 0 likes

#visual-tokenization

Beyond the Last Layer: Multi-Layer Representation Fusion for Visual Tokenization

Hugging Face Daily Papers ↗ · 2026-05-12 Cached

This paper introduces DRoRAE, a method that improves visual tokenization by fusing multi-layer features from pretrained vision encoders rather than relying solely on the last layer. It demonstrates significant improvements in reconstruction and generation quality on ImageNet and establishes a scaling law between fusion capacity and performance.

0 favorites 0 likes

visual-tokenization

InsightTok: Improving Text and Face Fidelity in Discrete Tokenization for Autoregressive Image Generation

Beyond the Last Layer: Multi-Layer Representation Fusion for Visual Tokenization

Submit Feedback