cross-modal-fusion

标签

Cards List
#cross-modal-fusion

面向高效全模态LLM的阶段自适应Token选择方法

Hugging Face Daily Papers · 2026-05-19 缓存

SEATS是一种无需训练的阶段自适应Token选择方法,通过逐步剪枝冗余的视觉和音频Token来降低全模态LLM的计算开销,实现了9.3倍FLOPs减少和4.8倍预填充加速,同时保持96.3%的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈