activation-regularization

#activation-regularization

From Weights to Features: SAE-Guided Activation Regularization for LLM Continual Learning

arXiv cs.LG ↗ · yesterday Cached

This paper proposes a continual learning method for LLMs that uses pretrained sparse autoencoders (SAEs) to regularize in activation space instead of weight space, achieving better memory efficiency and stronger performance on benchmarks while avoiding catastrophic forgetting without storing previous data.

0 favorites 0 likes

activation-regularization

From Weights to Features: SAE-Guided Activation Regularization for LLM Continual Learning

Submit Feedback