semantic-clustering

#semantic-clustering

GEM: Geometric Entropy Mixing for Optimal LLM Data Curation

arXiv cs.LG ↗ · 2026-05-27 Cached

GEM reformulates LLM data curation as a variational problem on the hypersphere, using geometric entropy mixing and a minorize-maximize algorithm to discover balanced semantic clusters, achieving state-of-the-art improvements in data mixing strategies by up to 1.2% average downstream accuracy.

0 favorites 0 likes

#semantic-clustering

RecMem: Recurrence-based Memory Consolidation for Efficient and Effective Long-Running LLM Agents

arXiv cs.CL ↗ · 2026-05-18 Cached

RecMem is a recurrence-based memory consolidation method for long-running LLM agents that reduces token consumption by up to 87% while improving accuracy, by only invoking LLMs when semantically similar interactions recur.

0 favorites 0 likes

semantic-clustering

GEM: Geometric Entropy Mixing for Optimal LLM Data Curation

RecMem: Recurrence-based Memory Consolidation for Efficient and Effective Long-Running LLM Agents

Submit Feedback