@HuggingPapers: Microsoft Research 推出 Arbor，一个使用持久假设树精炼的通用自主研究代理…

X AI KOLs Following 2026/06/11 13:23 模型

autonomous-agent research-agent microsoft-research hypothesis-tree cumulative-learning codex claude-code

摘要

Microsoft Research 推出 Arbor，一个使用持久假设树精炼进行累积学习的通用自主研究代理，在六个研究任务上超越 Codex 和 Claude Code，并在 MLE-Bench Lite 上达到 86% 的 Any-Medal。

Microsoft Research 推出 Arbor 一个通用自主研究代理，使用持久假设树精炼将长期探索转化为累积学习。它在六个研究任务上击败了 Codex 和 Claude Code，并在 MLE-Bench Lite 上达到 86% 的 Any-Medal。https://t.co/A1fxTxnskk

查看原文

查看缓存全文

缓存时间: 2026/06/11 17:39

微软研究院推出 Arbor

一款通用自主研究代理，利用持久假设树精炼将长期探索转化为累积学习。它在6项研究任务中击败了Codex和Claude Code，并在MLE-Bench Lite上达到86%的Any-Medal水平。https://t.co/A1fxTxnskk

@HuggingPapers: Microsoft Research 推出 Arbor，一个使用持久假设树精炼的通用自主研究代理…

相似文章

通过假设树优化实现通用自主研究

Arbor：树搜索作为自主代理的认知层

@_akhaliq: 论文:

@_akhaliq: 通过假设树精炼迈向通用自主研究

我在 LangGraph 上重新实现了 Arbor（一个能生长假设树的研究代理）—— 一个保留实验记录而非遗忘失败经验的代理

提交意见反馈