我越是用多个模型，就越觉得“AI共识”是个陷阱——分歧才是唯一值得关注的部分

Reddit r/artificial 2026/06/06 17:13 新闻

multi-model consensus disagreement reasoning ensemble ai-opinion

摘要

一篇反思文章，认为在多模型设置中，共识输出的价值低于分歧，分歧揭示了问题中真正存在争议的部分。文章质疑共识是否应该是目标，以及如何区分有建设性的分歧与无意义的噪音。

我在多模型设置（如 Karpathy 的 LLM Council，以及各种“问 5 个模型再合并”的工具）中反复看到一种模式，我认为它们大多数都在优化错误的目标。它们将达成一致视为目标。将问题输入多个模型，找出它们达成一致的地方，然后呈现共识。但根据我的经验，共识是最没用的输出。当五个模型达成一致时，通常只意味着问题很简单，或者更糟——它们都在从重叠的训练数据中匹配相同的标准答案。一致可能暗示共同的盲点，而不是正确性。真正有用的信号恰恰相反：它们产生分歧的地方，尤其是某个模型与其他模型不同的地方。那个分歧往往恰好指向问题中真正存在争议的部分。将其平均成一个整洁的共识答案，就等于丢弃了多模型方法唯一擅长产出的东西。这让我觉得这些系统的设计目标反了。你不需要一台制造一致的机器。你需要一台保留并解释分歧的机器——它能告诉你：“四个模型得出了这个结论，一个模型去了那边，并且解释为什么这个离群值可能看到了其他模型忽略的东西。”难点在于，我还没有一个清晰的答案：如何区分有建设性的分歧（真正的不同推理）与噪音分歧（模型随机不一致）？这条界线决定了这一切是信号还是昂贵的方差。很好奇从事多智能体或集成设置工作的人有什么想法。共识是错误的目标吗？你如何将真正的分歧与噪音分开？

查看原文

我越是用多个模型，就越觉得“AI共识”是个陷阱——分歧才是唯一值得关注的部分

相似文章

观察AI模型彼此意见分歧出乎意料地有用

当多个模型参与时，AI代理感觉更加可靠

共识在战略层面的不足：将推理轨迹分歧作为知识表示信号

Claude让我意识到大多数AI模型优化的是自信而非真相

目前正在构建的大多数AI代理都完全搞错了问题

提交意见反馈