@dair_ai: 本周 AI 热门论文 (5 月 4 日 - 10 日) - Conductor - HeavySkill - Horizon Generalization - 1000 台合成计算机…
摘要
本周 AI 研究论文精选汇总,涵盖 Conductor、HeavySkill、Horizon Generalization、合成计算机、自我改进预训练以及用于井字棋变体(Connect Four)的 AlphaZero 等主题。
查看缓存全文
缓存时间: 2026/05/10 18:28
本周 AI 顶级论文精选(5 月 4 日 - 10 日)
- Conductor
- HeavySkill
- Horizon Generalization(视野泛化)
- 1,000 Synthetic Computers(1000 台合成计算机)
- Self-Improving Pretraining(自我改进式预训练)
- Coordination as Architecture(将协调性作为架构)
- Connect Four AlphaZero from Scratch(从零开始的连四 AlphaZero)
继续阅读以获取更多信息:
相似文章
@dair_ai: https://x.com/dair_ai/status/2053495521243799717
DAIR AI 的每周精选汇总了多项重磅研究论文,包括通过内化并行推理提升模型性能的 HeavySkill,以及利用强化学习优化智能体编排的 Sakana AI Conductor。此外,还涵盖了 Meta FAIR 关于自我改进预训练的研究工作。
@simpreetkaur_19: AI工程师面试必读论文:1. Attention is all you need(Transformers)2. LoRA(低秩…
为面试准备的精选AI基础论文清单,涵盖Transformer、高效微调、视觉模型与生成网络。
PaperBench:评估AI复现AI研究的能力
OpenAI推出PaperBench,一个评估AI代理复现最先进AI研究能力的基准。该基准通过复现20篇ICML 2024论文,包含8,316个可评分任务。表现最好的模型(Claude 3.5 Sonnet)仅达到21%的复现分数,低于人类博士级别的表现,凸显了当前自主研究能力的局限性。
@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2054201045346287766
文章探讨了 Sakana AI 和 Meta 关于自我改进型 AI 智能体的最新研究,具体涉及达尔文-哥德尔机器(Darwin-Gödel Machine)和超智能体(Hyperagents),它们能够自主重写自身代码和基础设施以提升性能,且无需人工干预。
AI 一周要闻:AI 应用大爆发(Anthropic、OpenAI、Google)
OpenAI 全新 Codex 桌面应用把代码生成、浏览器自动化与持久化 Agent 集成进单一 IDE;Anthropic 为 Claude Code 新增并行会话功能;Google 推出桌面应用、Chrome 斜杠命令及一款高表现力 TTS 模型。