科学领域的代理型AI实验
摘要
本文介绍了两个代理型AI框架:DeepTS/DeepCollector和DeepScribe,它们利用混合本地-云端架构和大语言模型,自动化科学工作流程,包括时间序列数据整理以及将物理讲座转化为结构化报告。
arXiv:2605.26305v1 公告类型:新
摘要:本文详细介绍了两个用于开发自主代理型AI以支持科学工作流程的新型框架。两个系统均采用基于Google Colab的“本地身体、远程大脑”混合架构,利用基于Python的本地编排器调用大语言模型(LLM)云端后端。第一个代理DeepTS/DeepCollector可自动进行大规模时间序列数据集的整理、提取和去重。第二个代理DeepScribe是一款自主演示分析器,能够将视觉密集、数学复杂的物理讲座转化为结构化科学报告。通过实际的系统工程——如粒度属性提取(Cellular RAG)、远程数据检查和分布式并发控制——我们展示了代理型AI如何克服当前最先进系统在上下文和推理方面的限制,从而严格支持科学工作流程。最后,我们概述了DeepTS的泛化以支持深度知识图谱,并讨论了这一概念性方法在高能物理(DeepQCD)中的应用。
查看缓存全文
缓存时间: 2026/05/27 09:03
# 科学领域中的自主AI代理实验 来源:https://arxiv.org/abs/2605.26305 查看PDF(https://arxiv.org/pdf/2605.26305) > 摘要:本文详述了两种用于在科学工作流中开发自主、主动式AI代理的新颖框架。两个系统均采用通过Google Colab实现的混合"本地身体-远程大脑"架构,利用基于Python的本地编排器调用大型语言模型(LLM)云端后端。第一个代理DeepTS/DeepCollector,自动完成时间序列数据集的大规模整理、提取与去重。第二个代理DeepScribe,是一款自主演示文稿分析器,能将视觉密集、数学复杂的物理讲座转化为结构化的科学报告。通过实际的系统工程——如细粒度属性提取(细胞级RAG)、远程数据检查以及分布式并发控制——我们展示了自主AI代理如何克服当前最先进系统的上下文与推理局限,从而严谨地支持科学工作流。最后,我们概述了将DeepTS泛化以支持深度知识图谱的方案,并讨论了这种概念性方法在高能物理(DeepQCD)中的应用。 ## 提交历史 来自:Geoffrey Fox [查看邮件](https://arxiv.org/show-email/85017892/2605.26305) **[v1]** 2026年5月25日星期一 19:57:57 UTC(1,028 KB)
相似文章
大多数关于“智能体 AI”的讨论都感觉太抽象了。这里是我的智能体研究系统的实际样子
作者分享了他为识别和评估公司内 AI 用例而构建的智能体研究系统的实际分解。该系统使用六个智能体进行发现、评估和上下文提取,强调人在决策环中,而非完全自主。
神经数据不再无聊:代理型AI在数据复用中的基准测试
本文对代理型AI系统在加载、理解和重新格式化碎片化的神经科学数据任务上进行基准测试,发现尽管代理在子任务上表现良好,但很少能实现完全无错误的端到端解决方案,人工监督仍然必要。
@dair_ai: https://x.com/dair_ai/status/2061104052818108476
三篇值得关注的人工智能论文综述:SkillOpt 将技能文档视为可训练参数以优化冻结的智能体;一种新方法将智能体工作流编译成模型权重,实现100倍成本降低;而 AutoScientists 引入了一个去中心化智能体团队,无需中央规划者即可进行长期科学研究。
AutoSci:面向完整科研生命周期的以记忆为中心的智能代理系统
AutoSci是一个以记忆为中心的智能代理系统,旨在自动化完整的科学研究生命周期,从文献理解到回复审稿意见,使用基于LLM的智能体,具有持久记忆和自我进化能力。
观点:Agentic AI系统是实现AGI的可预见路径
本文认为,单一模型的单体型扩展不足以实现AGI,并提出具有多智能体协作的Agentic AI是必要的范式,理论上证明了代理系统在泛化和样本效率上具有指数级优势。