memory-consolidation

#memory-consolidation

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

Hugging Face Daily Papers ↗ · 2d ago Cached

This paper introduces a 'Sleep' paradigm for large language models that enables continual learning through memory consolidation and dreaming phases, allowing models to distill short-term knowledge into long-term parameters and self-improve without human supervision.

0 favorites 0 likes

#memory-consolidation

Language Models Need Sleep

Hacker News Top ↗ · 2026-05-26 Cached

This paper introduces a sleep-like consolidation mechanism for Transformer-based LLMs that periodically converts recent context into persistent fast weights in SSM blocks, clearing the KV cache to improve long-horizon reasoning without increasing inference latency.

0 favorites 0 likes

#memory-consolidation

Auto-Dreamer: Learning Offline Memory Consolidation for Language Agents

arXiv cs.CL ↗ · 2026-05-21 Cached

Auto-Dreamer introduces a learned offline memory consolidation method for language agents, decoupling fast memory acquisition from slow cross-session consolidation, and achieving higher performance with smaller memory banks, generalizing to unseen environments.

0 favorites 0 likes

memory-consolidation

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

Language Models Need Sleep

Auto-Dreamer: Learning Offline Memory Consolidation for Language Agents

Submit Feedback