我越是用多个模型,就越觉得“AI共识”是个陷阱——分歧才是唯一值得关注的部分

Reddit r/artificial 新闻

摘要

一篇反思文章,认为在多模型设置中,共识输出的价值低于分歧,分歧揭示了问题中真正存在争议的部分。文章质疑共识是否应该是目标,以及如何区分有建设性的分歧与无意义的噪音。

我在多模型设置(如 Karpathy 的 LLM Council,以及各种“问 5 个模型再合并”的工具)中反复看到一种模式,我认为它们大多数都在优化错误的目标。它们将达成一致视为目标。将问题输入多个模型,找出它们达成一致的地方,然后呈现共识。但根据我的经验,共识是最没用的输出。当五个模型达成一致时,通常只意味着问题很简单,或者更糟——它们都在从重叠的训练数据中匹配相同的标准答案。一致可能暗示共同的盲点,而不是正确性。真正有用的信号恰恰相反:它们产生分歧的地方,尤其是某个模型与其他模型不同的地方。那个分歧往往恰好指向问题中真正存在争议的部分。将其平均成一个整洁的共识答案,就等于丢弃了多模型方法唯一擅长产出的东西。这让我觉得这些系统的设计目标反了。你不需要一台制造一致的机器。你需要一台保留并解释分歧的机器——它能告诉你:“四个模型得出了这个结论,一个模型去了那边,并且解释为什么这个离群值可能看到了其他模型忽略的东西。”难点在于,我还没有一个清晰的答案:如何区分有建设性的分歧(真正的不同推理)与噪音分歧(模型随机不一致)?这条界线决定了这一切是信号还是昂贵的方差。很好奇从事多智能体或集成设置工作的人有什么想法。共识是错误的目标吗?你如何将真正的分歧与噪音分开?
查看原文

相似文章

观察AI模型彼此意见分歧出乎意料地有用

Reddit r/AI_Agents

本文讨论了比较多个AI模型的回答如何揭示推理中的漏洞和不确定性,并提出轻量级的多模型比较作为一种有用的验证层,在复杂的智能体编排之前进行应用。