gradient-projection

标签

Cards List
#gradient-projection

MAAT: 多阶段适配器感知定向遗忘

arXiv cs.LG · 2天前 缓存

本文指出了机器遗忘基准中的一个盲点:因果类(Why型)知识的代表性不足,并提出了5WBench(一个均衡的基准)和Maat(一个基于LoRA适配器的三阶段遗忘框架),该框架在因果事实的遗忘与保留方面均表现优异。

0 人收藏 0 人点赞
#gradient-projection

用于稳定多智能体策略学习的度量梯度投影

arXiv cs.LG · 2026-05-20

介绍HPML,一种将多智能体系统的联合更新场投影到度量梯度分量上以稳定和改进多智能体强化学习的方法。它提供了理论保证,并在CTDE基准测试上展示了改进的稳定性和回报。

0 人收藏 0 人点赞
#gradient-projection

干扰感知的多任务机器遗忘

arXiv cs.AI · 2026-05-20 缓存

本文介绍了一种干扰感知的多任务机器遗忘框架,通过任务感知的梯度投影和实例级别的梯度正交化来解决任务级和实例级干扰,在多任务计算机视觉基准上实现了有效的遗忘。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈