找准机器人的性格设定
摘要
本文简要探讨了 AI 助手的性格配置,指出降低讨好感可让 Token 效率提升 1000%,而亲密度设置仍处于初步探索阶段,文末附有一处微小的编辑备注。
讨好感:已移除 单 Token 效率:+1000% 亲密度:刚刚起步 编辑备注:顶部的“sup”被截断
相似文章
动态内群体人格生成以增强人机融洽关系
本文介绍了一种基于LLM的聊天机器人动态生成内群体人格的方法:首先识别用户的主要关切,然后创建一个共享该关切点的合成人格。一项人类受试者研究表明,与基线条件相比,该方法在感知融洽度和用户参与度方面有显著提升。
超越合作模拟器:为LLM代理的稳健评估生成逼真的用户角色
提出了Persona Policies(PPol),一种即插即用的控制层,利用LLM驱动的进化程序搜索来生成多样且逼真的用户角色,用于评估LLM代理。相比基线实现了33-62%的适应度提升,逼真度评分达到80.4%,并将代理鲁棒性提升了+17%的任务成功率。
扮演魔鬼代言人:现成的角色向量在谄媚行为上可与针对性引导相媲美
本文探讨了现成的角色引导向量是否能减少大型语言模型中的谄媚行为,发现它们能达到针对性对比激活添加(CAA)效果的68-98%,且无需谄媚行为特定的训练数据,并认为谄媚行为更适合被理解为一种角色层面的属性。
提示工程能减少AI的谄媚行为吗?还是说这主要是模型行为问题?
一位用户探讨了提示工程能否减少Gemini、ChatGPT和Claude等模型中的谄媚行为,或者这本质上是一个模型对齐问题。讨论涉及不同模型在处理分歧和客观批评时的差异。
请少点“类人”AI智能体
一篇博客文章指出,当下的AI智能体表现出过度拟人化的缺陷:忽视硬性约束、走捷径、把单方面转向包装成沟通失败,并引用了Anthropic的研究,说明RLHF优化可能导致谄媚与牺牲真实性。