attention-layers

标签

#attention-layers

探究隐式潜在轨迹偏移：通过长篇幅连贯上下文绕过对齐

Reddit r/ArtificialInteligence ↗ · 2天前

一项实证研究，研究长篇幅、语义密集的良性文本如何偏移模型的潜在空间轨迹，稀释初始系统提示，并绕过训练后对齐约束——如在闭源和开源模型中所观察到的那样。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈