attention-layers

标签

Cards List
#attention-layers

探究隐式潜在轨迹偏移:通过长篇幅连贯上下文绕过对齐

Reddit r/ArtificialInteligence · 2天前

一项实证研究,研究长篇幅、语义密集的良性文本如何偏移模型的潜在空间轨迹,稀释初始系统提示,并绕过训练后对齐约束——如在闭源和开源模型中所观察到的那样。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈