标签
Recursive 发布了一个自动化AI研究系统,在三个基准测试中取得了最先进的结果:固定预算语言模型训练、小模型训练速度和GPU内核优化。该系统自动化了研究循环,并开源了其运行中的产物。
Josh Tobin预告了Recursive_SI的自动化研究员,展示了性能优化能力的早期演示。
Recursive的自动AI研究系统通过在无需任务特定适配的情况下自动化研究循环,在NanoChat、NanoGPT Speedrun和GPU内核基准测试上达到了最先进的成果,并开源了相关工件以供进一步检验。
Recursive 发布了其自动化 AI 研究系统的早期成果,在固定预算语言模型训练、小模型训练速度以及 GPU 内核优化方面达到了业界领先水平,并开源了相关制品。
哈佛大学的 AutoScientists 提出一种去中心化的多智能体团队方案,让多个 Agent 共享实验状态、自动组队并评审研究方案,在多个基准上显著优于现有方法。
来自Meta、斯坦福和谷歌的一篇新论文提出了AutoResearchClaw,该方法通过整合故障恢复、辩论和选择性人工输入来改进自动化研究。它在ARC-Bench上以54.7%的优势超越了AI Scientist v2,并揭示了当受到过程约束而非无限自由时,自主性会得到增强。
SciAtlas是一个大规模、多学科的知识图谱,包含超过4300万篇论文和30亿个三元组,旨在通过神经符号检索算法为AI驱动的自动化科学研究提供结构化知识。
Jie Ding 教授开源了 Autoresearch 和 WorldSeed,这是两款 AI 代理框架,能够在一夜之间自主分析 72 篇同行评审论文以解决研究问题。
由前OpenAI研究副总裁Jerry Tworek 创立,专注自动化研究的新AI实验室,核心团队来自OAI、Anthropic 与 DeepMind。
Anthropic Fellows 的研究展示了一项使用 Claude Opus 4.6 加速对齐研究的实验,该研究关注弱到强监督,探索较弱的 AI 模型是否能在训练过程中有效监督较强的模型。
DeepLearning.AI 推出《Build with Andrew》课程,帮助零编程基础的用户在 30 分钟内利用 AI 构建 Web 应用;同时,最新研究聚焦大语言模型的透明度问题,涵盖模型诚实性与自动化科学研究能力等方向。
Anthropic 研究人员证明,Claude Opus 4.6 能够自主担任对齐研究者,以改进弱监督强技术,从而应对可扩展监督中的挑战。