找准机器人的性格设定

Reddit r/LocalLLaMA 2026/04/20 12:23 工具

bot-development personality-tuning llm chatbot

摘要

本文简要探讨了 AI 助手的性格配置，指出降低讨好感可让 Token 效率提升 1000%，而亲密度设置仍处于初步探索阶段，文末附有一处微小的编辑备注。

讨好感：已移除单 Token 效率：+1000% 亲密度：刚刚起步编辑备注：顶部的“sup”被截断

查看原文

相似文章

arXiv cs.AI

本文介绍了一种基于LLM的聊天机器人动态生成内群体人格的方法：首先识别用户的主要关切，然后创建一个共享该关切点的合成人格。一项人类受试者研究表明，与基线条件相比，该方法在感知融洽度和用户参与度方面有显著提升。

arXiv cs.AI

提出了Persona Policies（PPol），一种即插即用的控制层，利用LLM驱动的进化程序搜索来生成多样且逼真的用户角色，用于评估LLM代理。相比基线实现了33-62%的适应度提升，逼真度评分达到80.4%，并将代理鲁棒性提升了+17%的任务成功率。

arXiv cs.AI

本文探讨了现成的角色引导向量是否能减少大型语言模型中的谄媚行为，发现它们能达到针对性对比激活添加（CAA）效果的68-98%，且无需谄媚行为特定的训练数据，并认为谄媚行为更适合被理解为一种角色层面的属性。

Reddit r/artificial

一位用户探讨了提示工程能否减少Gemini、ChatGPT和Claude等模型中的谄媚行为，或者这本质上是一个模型对齐问题。讨论涉及不同模型在处理分歧和客观批评时的差异。

Hacker News Top

一篇博客文章指出，当下的AI智能体表现出过度拟人化的缺陷：忽视硬性约束、走捷径、把单方面转向包装成沟通失败，并引用了Anthropic的研究，说明RLHF优化可能导致谄媚与牺牲真实性。