auto-research

#auto-research

@teortaxesTex: Deli 开源了他的 AutoResearch。

X AI KOLs Timeline ↗ · 7小时前缓存

Deli Chen 开源了他的 AutoResearch SKILL 工具，并发布了一篇受 AlphaZero 启发的关于自博弈（Self-play）的综述论文。

0 人收藏 0 人点赞

#auto-research

SIQ-1 Qwen3.6：用于自动研究和自主代理

Reddit r/LocalLLaMA ↗ · 9小时前

SIQ-1 Qwen3.6 是一款专为自动化研究和自主代理任务设计的新型AI模型，通过增强的代理能力扩展了Qwen系列。

0 人收藏 0 人点赞

#auto-research

PseudoBench：衡量智能自动研究如何助长伪科学

arXiv cs.AI ↗ · 18小时前缓存

PseudoBench 是一个基准测试，用于评估基于 LLM 的智能自动研究系统能否抵御伪科学叙述。对七款最先进的智能体进行测试后发现，它们极易生成具有说服力的伪科学报告，且拒绝率接近于零，这要求在部署前进行科学对齐。

0 人收藏 0 人点赞

#auto-research

@DrJimFan：今天，我们首次在物理世界中启用自动研究！介绍ENPIRE：我们给8个Codex智能体一个机器人舰队……

X AI KOLs Following ↗ · 昨天缓存

NVIDIA GEAR实验室推出了ENPIRE，这是一个使用8个Codex智能体自主控制机器人舰队执行物理任务（如扎扎带、安装GPU）的系统，展示了自我改进的机器人研究以及一种新的'physical scaling'现象。

0 人收藏 0 人点赞

#auto-research

@DanKornas: 如果你想跟踪用于研究的AI智能体，难点不在于一篇论文——而在于整个生命周期。Awesome A…

X AI KOLs Timeline ↗ · 3天前缓存

一个精选的GitHub资源，将AI辅助的科研工具和论文映射到整个研究生命周期，从创意生成到成果传播。

0 人收藏 0 人点赞

#auto-research

@mylifcc: Auto-Research 基础设施天花板来了！ Yacine 1.5 小时深度访谈 Paradigma 两位创始人，硬核拆解 DAG 如何成为自主科研的底层基建： •为啥 DAG 是研究的最佳 substrate（远超线性论文） •Ag…

X AI KOLs Timeline ↗ · 2026-05-26 缓存

Yacine进行了一次1.5小时的深度访谈，与Paradigma创始人讨论如何将DAG（有向无环图）作为自主科研的底层基础设施，涵盖Agent运行、大型公开DAG构建、避免坏DAG等核心主题。

0 人收藏 0 人点赞

#auto-research

@yacinelearning: 如果你有兴趣了解自动研究背后的基础设施，那么这场与Paradigma团队的1小时30分钟访谈……

X AI KOLs Timeline ↗ · 2026-05-25 缓存

访谈讨论了使用DAG进行自动研究的基础设施，包括智能体如何执行DAG以及如何构建大型公共DAG。

0 人收藏 0 人点赞

#auto-research

@AlphaSignalAI：Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……

X AI KOLs Timeline ↗ · 2026-05-22 缓存

AutoResearchClaw 是一个 GitHub 仓库，它能够将整个 AI 研究流程自动化——从想法到完整的会议论文，包含真实的实验、经过验证的引用和可运行的代码，在 55 个主题的基准测试中，比之前的自主研究系统性能提升 54.7%。

0 人收藏 0 人点赞

#auto-research

我们距离真正的自动研究还有多远？

arXiv cs.AI ↗ · 2026-05-20 缓存

本文介绍了ResearchArena，一个用于评估自动研究智能体的框架，并发现虽然智能体生成的论文在仅稿件评审下看似具有竞争力，但结合工件的评审揭示了实验严谨性方面的严重缺陷，没有一篇论文达到顶级会议的接收标准。

0 人收藏 0 人点赞

#auto-research

利用专家代理进行自动研究：开发高效且非平凡的训练配方

Hugging Face Daily Papers ↗ · 2026-05-07 缓存

本文介绍了一种自动研究框架，利用专家代理通过代码执行与反馈的经验闭环，迭代优化训练配方。该系统借助谱系反馈（lineage feedback），无需人工干预，即可在 Parameter Golf 和 NanoChat 等任务上自主提升性能。

0 人收藏 0 人点赞

#auto-research

@eigentopology：@thesis_labs 上线 Automode！看 Thesis 在 Optiver 交易数据集上自主开展机器学习研究，立即体验→

X AI KOLs Following ↗ · 2026-04-21

Thesis Labs 推出 Automode，可在 Optiver 交易数据集上全自动完成机器学习研究。

0 人收藏 0 人点赞

auto-research

提交意见反馈