embedding-regularization

#embedding-regularization

SimReg: Achieving Higher Performance in the Pretraining via Embedding Similarity Regularization

arXiv cs.CL ↗ · 2026-05-12 Cached

This paper introduces SimReg, a regularization technique for LLM pretraining that uses embedding similarity to improve training convergence by over 30% and boost zero-shot performance.

0 favorites 0 likes

embedding-regularization

SimReg: Achieving Higher Performance in the Pretraining via Embedding Similarity Regularization

Submit Feedback