gated-delta-net

标签

Cards List
#gated-delta-net

@jiqizhixin: NVIDIA 新成果!你可以在不扰乱模型已有知识的前提下编辑其压缩记忆!推出 Gated DeltaNe…

X AI KOLs Timeline · 2026-05-22 缓存

NVIDIA 推出 Gated DeltaNet-2,一种在不导致灾难性遗忘的前提下编辑模型压缩记忆的方法,使用独立的门控机制分别执行擦除和写入操作。该方法在语言建模和长上下文任务上优于 Mamba-2、Mamba-3 等现有模型。

0 人收藏 0 人点赞
#gated-delta-net

@BlinkDL_AI:Gated DeltaNet-2 几乎就是 RWKV-7 的 DPLR 循环,却对房间里的大象视而不见

X AI KOLs Following · 2026-05-22 缓存

Ali Hatamizadeh 宣布了 Gated DeltaNet-2,一种新的线性注意力模型,在 1.3B 规模上优于 KDA 和 Mamba-3;@BlinkDL_AI 指出其循环与 RWKV-7 的 DPLR 几乎相同。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈