retriever

标签

Cards List
#retriever

FlashMemory DeepSeek-V4 检索器(GitHub仓库)

TLDR AI · 4天前 缓存

介绍了FlashMemory DeepSeek-V4检索器,这是一个轻量级模型,通过预测接下来将关注哪些块来稀疏化DeepSeek-V4的CSA KV缓存,仅保留约10-15%在设备上,同时匹配全注意力性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈