标签
LiteResearcher是一个可扩展的强化学习训练框架,专为深度研究智能体设计。
Anthropic 发布了 Claude Science,一个面向科学家的 AI 工作台,内置 60 多个科研技能,支持本地部署和 HPC 集群,可自主起草计算任务并审查结果。
Microsoft Research 推出 Arbor,一个使用持久假设树精炼进行累积学习的通用自主研究代理,在六个研究任务上超越 Codex 和 Claude Code,并在 MLE-Bench Lite 上达到 86% 的 Any-Medal。
DeepResearch 是一个基于 Spring AI Alibaba 构建的开源多智能体研究工具,能够将查询转化为结构化报告,它采用动态规划、多智能体角色、混合 RAG 和基于 Docker 的执行方式。
Tavily 宣布其 Deep Research API,这是一个单一端点,可端到端执行多步研究,并返回结构化且附有来源的报告。该 API 支持自定义文件、输出模式和可配置的研究模式。
由Weco构建的一个自主研究代理在OpenAI的Parameter Golf竞赛中按照合并记录数量成为顶级贡献者,展示了有效的人机协作。
Skill RSI 是一个免费工具,通过程序化评估和研究代理,以递归方式评估和改进 AI 技能,支持独立使用或作为 Codex 插件使用。
LangChain展示了一个宏观经济研究代理,该代理由Deep Agents、LangSmith和You.com金融研究API构建,可分析GDP数据、检测异常、调查部门层面的结构和周期性驱动因素,并生成结构化的、有引用的简报。
一位开发者使用Active Graph和monid_ai构建了一个完全可追溯且可分支的研究代理,确保每个声明都直接追溯到其来源,并在大约30分钟内使其正常工作。
使用 Active Graph 和 monid_ai 构建了一个完全可追踪和可复刻的研究智能体,确保每个主张都有凭证,避免了典型智能体的黑箱问题。
Hermes Agent现已集成xAI Grok订阅,允许用户添加X Research Agent配置文件,以便在工作时监控X平台。
TIGER-AI-Lab 发布 OpenResearcher,一款用于自动化长周期深度研究任务的开源智能体。