研究人员使用32块H100 GPU训练了一个Deep Research智能体，并开源了所有内容

Reddit r/LocalLLaMA 2026/06/19 08:20 模型

deep-research open-source agent training ai-research

摘要

研究人员使用32块H100 GPU训练了一个Deep Research智能体，并开源了所有组件，从而促进了社区访问和进一步开发。

暂无内容

查看原文

相似文章

X AI KOLs Timeline

一个小团队在学术预算下，仅使用32块H100和8K个合成样本，训练了一个前沿级别的深度研究智能体，并完全公开了从2B到35B模型的权重、代码和论文，这些模型在关键基准测试中匹配或超越了封闭的前沿智能体。

X AI KOLs Timeline

Yu Su 的团队在有限的学术预算下训练了一个前沿的 Deep Research Agent，使用 8K 合成样本和强化学习，并发布了完全开放的训练基础设施和从 2B 到 35B 参数的模型。

OpenAI Blog

OpenAI 推出 Deep Research，这是一个由早期版本 o3 驱动的智能体功能，能够为复杂任务执行多步网络研究。在向 Pro 用户推出前，已实施全面的安全测试和隐私保护。

arXiv cs.AI

本文介绍了S1-DeepResearch-32B，这是一个开源模型及包含15K条轨迹的数据集，用于深度研究代理，通过联合建模信息获取、知识综合与规划，在20个基准测试中取得了最先进的性能。

X AI KOLs Timeline

DeepSeek 研究员开源了 AutoResearch，这是一个自主框架，能够在无需人工干预的情况下，为 DeepSeek 285B 模型规划、执行并调试强化学习实验，并附带了一篇关于自我对弈的综述论文。