我制作了一个测试,能告诉你哪个LLM与你的个性和价值观最契合,基于对15个模型的个性与价值观研究 [R]
摘要
一个根据15个模型的研究,将用户与最符合其个性和价值观的LLM匹配的测试。
暂无内容
相似文章
我们向50个大语言模型发放了45份心理问卷。我们发现的结果并非“个性”。
研究人员分析了50个大语言模型在45份心理测量问卷上的表现,识别出一个“匹诺曹维度”(Pinocchio Dimension),该维度衡量模型如何认可内在体验,而非反映真实的人格特质。
人类心理测量问卷误判LLM行为特征
本文发现,人类心理测量问卷无法可靠预测LLM在真实交互中的行为,并提出基于生成的分析方法作为更准确的替代方案。
哪个 AI 最接近你的政治观点?我用同样的 117 个问题测试了 100 多个大语言模型
一项独立分析对 100 多个大语言模型进行了 117 个政治问题的测试,以绘制其意识形态倾向图谱,结果显示 DeepSeek 和 Grok 偏向左翼,而大多数其他模型则聚集在中间或右翼。
LLM人格归纳中的评估漂移:我们是否在移动目标?
本文研究对LLM在长篇散文上进行微调(结合关联的大五人格剖面)是否能稳定问卷回答并归纳目标剖面,发现虽然方差减小,但完整五维剖面的准确率仍接近随机水平。
在LLM个性化中重新以人类为中心
本文通过将真实人类重新引入评估循环,研究LLM个性化的有效性,揭示了在个性化管道的每个阶段人类判断与LLM输出之间的系统性差距,并强调了合成数据和LLM评判的局限性。