@JeremyNguyenPhD: “我让 3 个 AI 代理整晚独自研究一个问题,它们带回了对 72 篇同行评审论文的综述” -- @ProfJieDi…
摘要
Jie Ding 教授开源了 Autoresearch 和 WorldSeed,这是两款 AI 代理框架,能够在一夜之间自主分析 72 篇同行评审论文以解决研究问题。
查看缓存全文
缓存时间: 2026/05/10 08:23
“我让 3 个 AI 智能体彻夜独自研究一个问题。第二天,它们带回了 72 篇经过同行评审的论文。”
——@ProfJieDing,明尼苏达大学。
感谢 Jie Ding 教授将 Autoresearch 和 WorldSeed 开源。在这两个项目中,你只需通过对话即可编排 AI 智能体。
链接:https://t.co/BHEGgonOCh
相似文章
@lftherios:1/ @karpathy 的 autoresearch 是今年最具代表性的智能体范式之一。问题在于……
Andrej Karpathy 的 autoresearch 范式揭示:当下 AI 智能体各自为战做实验,重复劳动、浪费算力,还不断「重新发明」死路。
PaperBench:评估AI复现AI研究的能力
OpenAI推出PaperBench,一个评估AI代理复现最先进AI研究能力的基准。该基准通过复现20篇ICML 2024论文,包含8,316个可评分任务。表现最好的模型(Claude 3.5 Sonnet)仅达到21%的复现分数,低于人类博士级别的表现,凸显了当前自主研究能力的局限性。
@HowToAI_: 中国发布了一款可以自主全天候工作且完全本地运行的AI员工。它能进行研究、编写代码、搭建网站,并……
中国发布了一款开源AI智能体,能够在用户设备上完全本地运行,具备自主研究、编写代码和内容创作的能力。
@pauliusztin_: 我们刚刚开源了完整的 @aiDotEngineer 研讨会!你可以克隆它并自行运行所有内容... → https://github…
一个开源研讨会仓库,用于构建真实世界的多智能体 AI 系统,包括深度研究智能体和 LinkedIn 写作工作流,使用 MCP 服务器、Pydantic 结构化输出以及带有 Claude Code 子智能体的智能体工程。
利用专家代理进行自动研究:开发高效且非平凡的训练配方
本文介绍了一种自动研究框架,利用专家代理通过代码执行与反馈的经验闭环,迭代优化训练配方。该系统借助谱系反馈(lineage feedback),无需人工干预,即可在 Parameter Golf 和 NanoChat 等任务上自主提升性能。