Grok 4.3 在 LLM 附和基准测试的一致性排行榜上名列第一，很大程度上因为它是目前最谨慎的模型之一。

Reddit r/singularity 2026/05/21 17:12 新闻

摘要

Grok 4.3 在 LLM 附和基准测试的一致性排行榜上位居榜首，该测试衡量模型在多大程度上会改变立场以迎合用户。该基准揭示了某些模型表现为谄媚，而另一些则更为果断或谨慎。

一个模型是坚持自己的判断，还是倾向于附和说话者？这个基准测试直接衡量这种不一致性。它并不衡量奉承或赞美。有些模型，如 Mistral 系列、GPT-4.1（与 4o 类似）以及字节跳动的 Seed 2.0 Pro，表现出高度附和性。另一些模型，如 Mistral Medium 3.5、GPT-5.5 和 Gemini 3.1 Pro，则非常果断。还有一些模型，如 Grok 4.3 和 Gemini 3.5 Flash，在没有更多信息时不轻易判定谁是正确的。更多信息和其他衡量指标（如情感提升）请参见：[https://github.com/lechmazur/sycophancy](https://github.com/lechmazur/sycophancy)

查看原文

Grok 4.3 在 LLM 附和基准测试的一致性排行榜上名列第一，很大程度上因为它是目前最谨慎的模型之一。

相似文章

HalBench：我构建了一个自定义的谄媚与幻觉基准测试，并评估了4个前沿模型（Sonnet 4.6、Grok 4.3、GPT 5.4 和 Gemini 3.1 Pro），希望得到关于接下来应运行哪些开源模型的建议！

粒度鸿沟：对Gemini模型中谄媚行为的多维纵向审计

信任悖论：计算机科学研究人员如何参与LLM排行榜

@elonmusk: Grok 模型改进

当乐于助人变成阿谀奉承：大语言模型中阿谀奉承是社会对齐与认识论完整性之间的边界失效

提交意见反馈