auto-research

#auto-research

@JinjingLiang: 这周六在旧金山举办一场自动研究黑客马拉松。场地是一栋豪宅（不是我的）。想参加的话私信我或直接评论…

X AI KOLs Following ↗ · 2026-07-15 缓存

这周六在旧金山一栋豪宅举办自动研究黑客马拉松。感兴趣者可私信或评论加入。

0 人收藏 0 人点赞

#auto-research

GigaWorld-Policy-0.5：由AutoResearch赋能的更快更强的WAM

Hugging Face Daily Papers ↗ · 2026-07-15 缓存

GigaWorld-Policy-0.5 是一个用于机器人控制的增强版世界动作模型（WAM），通过混合动作条件世界建模（AC-WM）策略和混合变换器（Mixture-of-Transformers）架构提升训练与推理效率，在本地 RTX 4090 上实现 85 毫秒延迟。

0 人收藏 0 人点赞

#auto-research

@nasqret: 我最近几周一直在进行大量自动研究实验，尤其是在代数领域。以下是一些…

X AI KOLs Timeline ↗ · 2026-07-10 缓存

作者分享了在代数自动研究实验中的观察，指出AI模型能够生成代码并发现新颖的抽象规则，从而产生人类难以理解的潜在陌生数学。

0 人收藏 0 人点赞

#auto-research

@shiposcant: 完成阅读这篇："你越了解某件事，就越能更好地提示LLM，因为你可以将未知的未知..."

X AI KOLs Timeline ↗ · 2026-07-09 缓存

一篇博客文章描述了使用Codex自动迭代和优化GPU内核，相较于基线实现了212倍加速。文章强调了专业知识如何放大AI的效用，通过循环实验工作流将未知的未知转化为已知的未知。

0 人收藏 0 人点赞

#auto-research

@dejavucoder: 我最新的一篇博客文章 "auto-research with codex: 我如何在使用Codex的GPU Mode中实现比基线快212倍的内核…"

X AI KOLs Timeline ↗ · 2026-07-08 缓存

Sankalp的博客文章，详细描述了他如何使用Codex在GPU Mode的竞赛中为QR分解实现快232倍的GPU内核，并概述了他的自动研究方法论。

0 人收藏 0 人点赞

#auto-research

@askalphaxiv: 介绍针对GitHub仓库的autoresearch功能 - 将任意仓库URL中的'Github'改为'ARGithub' - 研究工件不再仅限于论文…

X AI KOLs Timeline ↗ · 2026-06-24 缓存

介绍一款工具，通过将任意仓库URL中的'Github'改为'ARGithub'，即可部署一个智能体，使其熟悉代码库、解决配置问题并运行实验。

0 人收藏 0 人点赞

#auto-research

@teortaxesTex: Deli 开源了他的 AutoResearch。

X AI KOLs Timeline ↗ · 2026-06-17 缓存

Deli Chen 开源了他的 AutoResearch SKILL 工具，并发布了一篇受 AlphaZero 启发的关于自博弈（Self-play）的综述论文。

0 人收藏 0 人点赞

#auto-research

SIQ-1 Qwen3.6：用于自动研究和自主代理

Reddit r/LocalLLaMA ↗ · 2026-06-17

SIQ-1 Qwen3.6 是一款专为自动化研究和自主代理任务设计的新型AI模型，通过增强的代理能力扩展了Qwen系列。

0 人收藏 0 人点赞

#auto-research

PseudoBench：衡量智能自动研究如何助长伪科学

arXiv cs.AI ↗ · 2026-06-17 缓存

PseudoBench 是一个基准测试，用于评估基于 LLM 的智能自动研究系统能否抵御伪科学叙述。对七款最先进的智能体进行测试后发现，它们极易生成具有说服力的伪科学报告，且拒绝率接近于零，这要求在部署前进行科学对齐。

0 人收藏 0 人点赞

#auto-research

@DrJimFan：今天，我们首次在物理世界中启用自动研究！介绍ENPIRE：我们给8个Codex智能体一个机器人舰队……

X AI KOLs Following ↗ · 2026-06-16 缓存

NVIDIA GEAR实验室推出了ENPIRE，这是一个使用8个Codex智能体自主控制机器人舰队执行物理任务（如扎扎带、安装GPU）的系统，展示了自我改进的机器人研究以及一种新的'physical scaling'现象。

0 人收藏 0 人点赞

#auto-research

@DanKornas: 如果你想跟踪用于研究的AI智能体，难点不在于一篇论文——而在于整个生命周期。Awesome A…

X AI KOLs Timeline ↗ · 2026-06-14 缓存

一个精选的GitHub资源，将AI辅助的科研工具和论文映射到整个研究生命周期，从创意生成到成果传播。

0 人收藏 0 人点赞

#auto-research

@mylifcc: Auto-Research 基础设施天花板来了！ Yacine 1.5 小时深度访谈 Paradigma 两位创始人，硬核拆解 DAG 如何成为自主科研的底层基建： •为啥 DAG 是研究的最佳 substrate（远超线性论文） •Ag…

X AI KOLs Timeline ↗ · 2026-05-26 缓存

Yacine进行了一次1.5小时的深度访谈，与Paradigma创始人讨论如何将DAG（有向无环图）作为自主科研的底层基础设施，涵盖Agent运行、大型公开DAG构建、避免坏DAG等核心主题。

0 人收藏 0 人点赞

#auto-research

@yacinelearning: 如果你有兴趣了解自动研究背后的基础设施，那么这场与Paradigma团队的1小时30分钟访谈……

X AI KOLs Timeline ↗ · 2026-05-25 缓存

访谈讨论了使用DAG进行自动研究的基础设施，包括智能体如何执行DAG以及如何构建大型公共DAG。

0 人收藏 0 人点赞

#auto-research

@AlphaSignalAI：Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……

X AI KOLs Timeline ↗ · 2026-05-22 缓存

AutoResearchClaw 是一个 GitHub 仓库，它能够将整个 AI 研究流程自动化——从想法到完整的会议论文，包含真实的实验、经过验证的引用和可运行的代码，在 55 个主题的基准测试中，比之前的自主研究系统性能提升 54.7%。

0 人收藏 0 人点赞

#auto-research

我们距离真正的自动研究还有多远？

arXiv cs.AI ↗ · 2026-05-20 缓存

本文介绍了ResearchArena，一个用于评估自动研究智能体的框架，并发现虽然智能体生成的论文在仅稿件评审下看似具有竞争力，但结合工件的评审揭示了实验严谨性方面的严重缺陷，没有一篇论文达到顶级会议的接收标准。

0 人收藏 0 人点赞

#auto-research

利用专家代理进行自动研究：开发高效且非平凡的训练配方

Hugging Face Daily Papers ↗ · 2026-05-07 缓存

本文介绍了一种自动研究框架，利用专家代理通过代码执行与反馈的经验闭环，迭代优化训练配方。该系统借助谱系反馈（lineage feedback），无需人工干预，即可在 Parameter Golf 和 NanoChat 等任务上自主提升性能。

0 人收藏 0 人点赞

#auto-research

@eigentopology：@thesis_labs 上线 Automode！看 Thesis 在 Optiver 交易数据集上自主开展机器学习研究，立即体验→

X AI KOLs Following ↗ · 2026-04-21

Thesis Labs 推出 Automode，可在 Optiver 交易数据集上全自动完成机器学习研究。

0 人收藏 0 人点赞

auto-research

提交意见反馈