knowledge-suppression

#knowledge-suppression

Multilingual Unlearning in LLMs: Transfer, Dynamics, and Reversibility

arXiv cs.CL ↗ · 5d ago Cached

This paper studies multilingual unlearning in LLMs by extending the TOFU benchmark to five languages. It finds that unlearning transfer varies by script and family, operates primarily in later decoding layers, and that a single steering direction can recover much of the suppressed knowledge across languages.

0 favorites 0 likes

knowledge-suppression

Multilingual Unlearning in LLMs: Transfer, Dynamics, and Reversibility

Submit Feedback