shadow-model

#shadow-model

Membership Inference Attacks on Discrete Diffusion Language Models

arXiv cs.LG ↗ · 2026-05-19 Cached

This paper studies membership inference attacks (MIA) on fine-tuned masked diffusion language models (MDLMs). It proposes a white-box attack using a 46-dimensional feature vector from the model's reconstruction loss at varying masking ratios, achieving high AUC scores and showing MDLMs are more vulnerable than previously thought.

0 favorites 0 likes

shadow-model

Membership Inference Attacks on Discrete Diffusion Language Models

Submit Feedback