fast-weights

#fast-weights

语言模型需要睡眠

Hugging Face Daily Papers ↗ · 2026-05-25 缓存

本文提出了一种针对Transformer模型的类睡眠巩固机制，该机制利用快速权重和递归传递来改进长上下文处理，同时保持推理速度。

0 人收藏 0 人点赞

#fast-weights

Hugging Face Daily Papers ↗ · 2026-05-08 缓存

FAAST提出了一种前馈方法，通过解析方式将标注样本编译为快速权重，无需反向传播即可实现高效的测试时监督适应，在保持性能的同时提升90%以上的速度和节省95%的内存。

0 人收藏 0 人点赞