llm-personalization

标签

Cards List
#llm-personalization

测试时个性化:针对缩放失败的一种诊断框架与概率修正方法

arXiv cs.LG · 19小时前 缓存

本文提出了测试时个性化(TTP),这是一种通过候选采样和基于奖励的选择来扩展推理时计算,从而提升大语言模型(LLM)个性化能力的框架。该研究诊断了标准奖励模型中的失效模式,并提出了一种概率个性化奖励模型以缓解这些问题。

0 人收藏 0 人点赞
#llm-personalization

超越静态人格:大型语言模型的情境人格引导

arXiv cs.CL · 2026-04-20 缓存

本文介绍了IRiS,一种无需训练的情境人格引导框架,它通过识别和利用情境依赖的人格神经元,超越了静态人格建模。该方法表明,大型语言模型的行为随情境变化,并提出了基于神经元的识别、检索和加权引导方法,在PersonalityBench和新增的SPBench基准上得到验证。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈