llm-personalization

#llm-personalization

测试时个性化：针对缩放失败的一种诊断框架与概率修正方法

arXiv cs.LG ↗ · 19小时前缓存

本文提出了测试时个性化（TTP），这是一种通过候选采样和基于奖励的选择来扩展推理时计算，从而提升大语言模型（LLM）个性化能力的框架。该研究诊断了标准奖励模型中的失效模式，并提出了一种概率个性化奖励模型以缓解这些问题。

0 人收藏 0 人点赞

#llm-personalization

arXiv cs.CL ↗ · 2026-04-20 缓存

本文介绍了IRiS，一种无需训练的情境人格引导框架，它通过识别和利用情境依赖的人格神经元，超越了静态人格建模。该方法表明，大型语言模型的行为随情境变化，并提出了基于神经元的识别、检索和加权引导方法，在PersonalityBench和新增的SPBench基准上得到验证。

0 人收藏 0 人点赞