geometry-conflict

#geometry-conflict

Geometry Conflict: Explaining and Controlling Forgetting in LLM Continual Post-Training

Hugging Face Daily Papers ↗ · 4d ago Cached

This research investigates how task geometry influences continual post-training in LLMs, identifying 'geometry conflict' as a cause of forgetting and a mechanism for controlling update integration. The authors propose Geometry-Conflict Wasserstein Merging (GCWM), a data-free method that improves retention and performance across various model sizes.

0 favorites 0 likes

geometry-conflict

Geometry Conflict: Explaining and Controlling Forgetting in LLM Continual Post-Training

Submit Feedback