auto-research

标签

Cards List
#auto-research

@teortaxesTex: Deli 开源了他的 AutoResearch。

X AI KOLs Timeline · 5小时前 缓存

Deli Chen 开源了他的 AutoResearch SKILL 工具,并发布了一篇受 AlphaZero 启发的关于自博弈(Self-play)的综述论文。

0 人收藏 0 人点赞
#auto-research

SIQ-1 Qwen3.6:用于自动研究和自主代理

Reddit r/LocalLLaMA · 8小时前

SIQ-1 Qwen3.6 是一款专为自动化研究和自主代理任务设计的新型AI模型,通过增强的代理能力扩展了Qwen系列。

0 人收藏 0 人点赞
#auto-research

PseudoBench:衡量智能自动研究如何助长伪科学

arXiv cs.AI · 16小时前 缓存

PseudoBench 是一个基准测试,用于评估基于 LLM 的智能自动研究系统能否抵御伪科学叙述。对七款最先进的智能体进行测试后发现,它们极易生成具有说服力的伪科学报告,且拒绝率接近于零,这要求在部署前进行科学对齐。

0 人收藏 0 人点赞
#auto-research

@DrJimFan:今天,我们首次在物理世界中启用自动研究!介绍ENPIRE:我们给8个Codex智能体一个机器人舰队……

X AI KOLs Following · 昨天 缓存

NVIDIA GEAR实验室推出了ENPIRE,这是一个使用8个Codex智能体自主控制机器人舰队执行物理任务(如扎扎带、安装GPU)的系统,展示了自我改进的机器人研究以及一种新的'physical scaling'现象。

0 人收藏 0 人点赞
#auto-research

@DanKornas: 如果你想跟踪用于研究的AI智能体,难点不在于一篇论文——而在于整个生命周期。Awesome A…

X AI KOLs Timeline · 3天前 缓存

一个精选的GitHub资源,将AI辅助的科研工具和论文映射到整个研究生命周期,从创意生成到成果传播。

0 人收藏 0 人点赞
#auto-research

@mylifcc: Auto-Research 基础设施天花板来了! Yacine 1.5 小时深度访谈 Paradigma 两位创始人,硬核拆解 DAG 如何成为自主科研的底层基建: •为啥 DAG 是研究的最佳 substrate(远超线性论文) •Ag…

X AI KOLs Timeline · 2026-05-26 缓存

Yacine进行了一次1.5小时的深度访谈,与Paradigma创始人讨论如何将DAG(有向无环图)作为自主科研的底层基础设施,涵盖Agent运行、大型公开DAG构建、避免坏DAG等核心主题。

0 人收藏 0 人点赞
#auto-research

@yacinelearning: 如果你有兴趣了解自动研究背后的基础设施,那么这场与Paradigma团队的1小时30分钟访谈……

X AI KOLs Timeline · 2026-05-25 缓存

访谈讨论了使用DAG进行自动研究的基础设施,包括智能体如何执行DAG以及如何构建大型公共DAG。

0 人收藏 0 人点赞
#auto-research

@AlphaSignalAI:Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……

X AI KOLs Timeline · 2026-05-22 缓存

AutoResearchClaw 是一个 GitHub 仓库,它能够将整个 AI 研究流程自动化——从想法到完整的会议论文,包含真实的实验、经过验证的引用和可运行的代码,在 55 个主题的基准测试中,比之前的自主研究系统性能提升 54.7%。

0 人收藏 0 人点赞
#auto-research

我们距离真正的自动研究还有多远?

arXiv cs.AI · 2026-05-20 缓存

本文介绍了ResearchArena,一个用于评估自动研究智能体的框架,并发现虽然智能体生成的论文在仅稿件评审下看似具有竞争力,但结合工件的评审揭示了实验严谨性方面的严重缺陷,没有一篇论文达到顶级会议的接收标准。

0 人收藏 0 人点赞
#auto-research

利用专家代理进行自动研究:开发高效且非平凡的训练配方

Hugging Face Daily Papers · 2026-05-07 缓存

本文介绍了一种自动研究框架,利用专家代理通过代码执行与反馈的经验闭环,迭代优化训练配方。该系统借助谱系反馈(lineage feedback),无需人工干预,即可在 Parameter Golf 和 NanoChat 等任务上自主提升性能。

0 人收藏 0 人点赞
#auto-research

@eigentopology:@thesis_labs 上线 Automode!看 Thesis 在 Optiver 交易数据集上自主开展机器学习研究,立即体验→

X AI KOLs Following · 2026-04-21

Thesis Labs 推出 Automode,可在 Optiver 交易数据集上全自动完成机器学习研究。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈