persona-steering

标签

Cards List
#persona-steering

提示-激活对偶性:通过注意力层干预改进激活引导

Hugging Face Daily Papers · 4天前 缓存

本文识别出KV缓存污染是对话中激活引导的一种失败模式,并提出了GCAD方法,该方法从提示贡献中提取引导信号,并应用词元级门控来改进长程连贯性,在多轮基准上取得了显著提升。

0 人收藏 0 人点赞
#persona-steering

超越静态人格:大型语言模型的情境人格引导

arXiv cs.CL · 2026-04-20 缓存

本文介绍了IRiS,一种无需训练的情境人格引导框架,它通过识别和利用情境依赖的人格神经元,超越了静态人格建模。该方法表明,大型语言模型的行为随情境变化,并提出了基于神经元的识别、检索和加权引导方法,在PersonalityBench和新增的SPBench基准上得到验证。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈