标签
哈佛大学的 AutoScientists 提出一种去中心化的多智能体团队方案,让多个 Agent 共享实验状态、自动组队并评审研究方案,在多个基准上显著优于现有方法。
来自Meta、斯坦福和谷歌的一篇新论文提出了AutoResearchClaw,该方法通过整合故障恢复、辩论和选择性人工输入来改进自动化研究。它在ARC-Bench上以54.7%的优势超越了AI Scientist v2,并揭示了当受到过程约束而非无限自由时,自主性会得到增强。
一项研究评估了前沿模型预测科学进展的能力,涵盖4760个事件,发现它们可以识别可能的方向,但无法可靠预测结果或时间线,且存在系统性过度自信。
A comprehensive open-source collection of 138 scientific agent skills that transform AI coding assistants like Claude Code and Codex into AI scientists, covering biology, chemistry, medicine, and more, with integration of over 100 scientific databases and specialized Python packages.
本文介绍了AI CFD Scientist,一个用于计算流体动力学的开源AI代理,它利用视觉语言验证和代码修改自主发现物理修正,在CFD任务上优于通用AI科学家。
EvoScientist 是一个用于端到端科学发现的自适应多智能体框架,通过持久化记忆模块持续改进,由三个专业智能体组成,分别负责创意生成、实验执行和知识提炼。它在科学创意生成方面超越了7个当前最先进的系统,并通过多智能体进化提升了代码执行成功率。