multi-token-generation

#multi-token-generation

BitLM: Unlocking Multi-Token Language Generation with Bitwise Continuous Diffusion

arXiv cs.CL ↗ · 2026-05-13 Cached

This paper introduces BitLM, a language model that uses bitwise continuous diffusion to generate multiple tokens in parallel, aiming to overcome the sequential bottleneck of traditional autoregressive generation while preserving causal structure.

0 favorites 0 likes

multi-token-generation

BitLM: Unlocking Multi-Token Language Generation with Bitwise Continuous Diffusion

Submit Feedback