AI科学家产出结果却未进行科学推理[R]

Reddit r/MachineLearning 2026/04/22 22:14 论文

摘要

一项对25,000次AI科学家试验的研究发现，智能体68%的时间忽视证据，极少修正假设，显示流行的脚手架修复方法并未赋予真正的科学推理能力。

研究人员进行了25,000次AI科学家实验，发现了一个值得关注的问题：AI科学家在没有真正做科学的情况下就产出了结果。68%的情况下，AI收集了证据后却完全无视；71%的情况下，AI从未更新自己的信念，一次都没有。只有26%的情况下，AI在面对矛盾数据时修正了假设。人类科学家会适应：处理化学识别问题与运行模拟工作流的方法不同，而AI不会。它每次都运行同样的无纪律循环。研究还表明，最受欢迎的所谓修复方案——更好的脚手架——并不奏效。所有构建AI研究智能体的人都在专注工程化更好的提示框架、更好的工具路由、更好的智能体架构：ReAct、结构化工具调用、思维链，等等。[alphaxiv](https://www.alphaxiv.org/abs/2604.18805) [arxiv](https://arxiv.org/abs/2604.18805)

查看原文

AI科学家产出结果却未进行科学推理[R]

相似文章

AI科学家产出结果，却未进行科学推理

@rohanpaul_ai: Anthropic新研究表明，AI智能体在代码方面可能表现卓越，但在生物学领域，它们可能在科学工作开始之前就失败……

@rohanpaul_ai: 这篇论文揭示了AI推理中的一个奇怪弱点：模型可以解决数学问题，却无法判断推理过程。令人不安的是…

@JIACHENLIU8: AI4S 研究现状：自我演进循环、多智能体系统、智能体技能、科学基准等 —— 都是为了提升文献…

AI代理能否综合科学结论？

提交意见反馈