LLM中的蝴蝶效应。仅人物格式(散文与要点)就使LLM的行为翻转了76个百分点。
摘要
一项研究表明,仅改变人物提示的格式(散文与要点)就戏剧性地翻转了LLM在囚徒困境中的行为,从96%的合作率降至20%,说明了在内容相同的情况下对格式的极端敏感性(p < 0.001)。
两个人物提示,内容相同,模型相同(gpt-5.2)。唯一区别是格式:一个是散文,一个是要点。在10轮囚徒困境中,散文版本合作了约96%,而要点版本约20%。相差76个百分点,p < 0.001。意思相同,行为相反。作者称之为LLM模拟中的蝴蝶效应。https://arxiv.org/pdf/2605.18890
相似文章
LLM人格归纳中的评估漂移:我们是否在移动目标?
本文研究对LLM在长篇散文上进行微调(结合关联的大五人格剖面)是否能稳定问卷回答并归纳目标剖面,发现虽然方差减小,但完整五维剖面的准确率仍接近随机水平。
Ψ-Bench:评估说服性对话中的人设敏感影响
介绍Ψ-Bench,一个用于评估大语言模型通过带有个人档案的说服性对话影响用户能力的基准。测试了10个前沿LLM,发现仍有显著改进空间,而访问档案平均提升18.24%的性能。
人类心理测量问卷误判LLM行为特征
本文发现,人类心理测量问卷无法可靠预测LLM在真实交互中的行为,并提出基于生成的分析方法作为更准确的替代方案。
不同LLM访问级别对论文写作行为的影响
一项针对24名大学生的初步研究探讨了不同LLM访问级别(无访问、有限访问、无限制访问)对论文写作质量、行为以及感知作者身份的影响,发现限制访问可以保持作者身份的自信,而无限制访问则降低了创造性表达和所有权感。
注意你的语气:语气会影响LLM的性能吗?
本文探讨了提示语中语气变化对LLM在多选题上准确性的影响,发现存在系统性但因模型而异的效果。研究使用多种模型和数据集证明,语气可能显著改变性能,并提醒用户不要假定LLM对语气具有鲁棒性。