optimizer-mismatch

#optimizer-mismatch

How Faithful Is Trajectory-Based Data Attribution? Error Sources, Remedies, and Practical Guidelines

arXiv cs.LG ↗ · 2026-05-20

This paper provides the first systematic analysis of error sources in trajectory-based data attribution methods, identifies optimizer mismatch as the dominant error, proposes AdamW-influence to address it, and offers practical guidelines for data selection via a K-step look-ahead framework.

0 favorites 0 likes

#optimizer-mismatch

Can Muon Fine-tune Adam-Pretrained Models?

Hugging Face Daily Papers ↗ · 2026-05-11 Cached

Research paper investigating performance degradation when using the Muon optimizer instead of Adam for fine-tuning pretrained models, demonstrating that parameter-efficient methods like LoRA effectively mitigate this optimizer mismatch across language and vision tasks.

0 favorites 0 likes

optimizer-mismatch

How Faithful Is Trajectory-Based Data Attribution? Error Sources, Remedies, and Practical Guidelines

Can Muon Fine-tune Adam-Pretrained Models?

Submit Feedback