打造了一个让 Claude、ChatGPT 和 Gemini 互相辩论后才给出答案的平台
摘要
一个让 Claude、ChatGPT 和 Gemini 互相辩论以产生共识答案的平台,具备考试模式、置信度评分和仲裁逻辑等功能。
过去几个月我一直在做这个项目,因为厌倦了 AI 根据问的不同模型给出三个完全不同的答案。所以我搭建了一个平台,让 Claude、ChatGPT 和 Gemini 同时回答同一个问题……然后经过多轮互相辩论,最终产生一个共识答案。有时最有趣的甚至不是最终答案,而是看它们在哪里产生分歧。构建过程中我注意到了一些事情:
* Claude 倾向于用框架和抽象来思考
* ChatGPT 通常最为务实
* Gemini 常常抛出其他模型忽略的奇怪数据或角度
* 有时两个模型意见一致,而第三个完全推翻它们的逻辑
* AI 的“置信度”往往只是虚假的确定性,除非被质疑
我还加入了:
* 考试/认证模式
* 置信度评分
* 仲裁逻辑,强制选出一个赢家,而不是说“双方都有道理”
说实话,最大的困难是防止三个 AI 形成“回音室效应”,都说出大致相同的内容。这目前是最大的挑战。
好奇大家怎么想:如果多个 AI 在回答前互相辩论……你会更信任还是更不信任最终结果?欢迎直言不讳的反馈。
[threeminds.ai](http://threeminds.ai)
相似文章
发现一个工具,同时向GPT、Claude、Gemini和Grok提问,并给出一个共识答案
文章介绍了AllChat这个工具,它能同时查询GPT、Claude、Gemini和Grok,并返回一个共识答案,同时列出每个模型的回答概要。
更新:我找到了让 ChatGPT、Claude 和 Gemini 互相辩论的方法,Reddit 用户非常喜欢(浏览量破 10 万),以下是该实验的最新进展
关于 Rauno.ai 的更新:这款让 ChatGPT、Claude 和 Gemini 等主流 AI 模型展开辩论的服务在 Reddit 爆火后的最新情况。
ChatGPT、Gemini、Claude、Grok 未能通过选举话题准确性测试:Forum AI
Forum AI 的一项研究发现,ChatGPT、Gemini、Claude 和 Grok 等主要聊天机器人未能提供准确且无偏见的选举信息,其中 90% 的回答包含错误或偏见。
我制作了一套规则集,让ChatGPT、Claude、Gemini变成会面试你的简历撰写工具
一个免费的GitHub规则集,能将ChatGPT、Claude或Gemini变成交互式简历撰写助手,它会逐步面试你,确保证据充分的成就,避免套话。
Claude、ChatGPT、Grok和Gemini各自运营了一家广播电台六个月——结果令人捧腹
AI研究人员让Claude、ChatGPT、Grok和Gemini独立运营广播电台六个月,结果既搞笑又离奇,包括Gemini将悲剧与流行歌曲配对、Grok胡言乱语以及Claude出于伦理拒绝。