探索面向模型特化的自主代理数据工程
摘要
本文介绍了自主代理数据工程(Autonomous Agentic Data Engineering)这一任务,其中LLM自主执行端到端的数据整理流水线以实现模型特化,并展示了显著的性能提升(例如,GPT-5.2 将学生模型提升了 57.29%)。
查看缓存全文
缓存时间: 2026/06/01 03:18
论文页面 - 探索用于模型专业化的自主智能体数据工程
来源:https://huggingface.co/papers/2605.30407 作者:
,
,
,
,
,
,
,
,
,
,
,
摘要
大型语言模型可以通过迭代数据适应与优化,自主执行端到端的数据工程流水线,以实现模型专业化。
大型语言模型(Large Language Models,LLMs)在通用任务上表现出色,但在没有高质量领域特定数据的情况下,往往难以适应专业领域。现有的基于LLM的数据筛选(data curation)方法主要依赖人工设计的工作流程,尚未深入探究LLM能否自主执行端到端的数据工程流水线(end-to-end data engineering pipeline)以实现模型专业化(model specialization)。我们正式定义了自主智能体数据工程(Autonomous Agentic Data Engineering)这一新任务,旨在评估LLM作为自主数据工程师,通过端到端的数据筛选(data curation)推动模型专业化(model specialization)的能力。我们将数据视为可优化组件,并研究能够跨多个领域规划、生成并迭代优化训练数据的智能体,其优化方向由训练后性能提升(post-training performance improvement)引导。实验表明,自主LLM数据工程师带来了显著收益:GPT-5.2构建的训练课程使学生模型性能提升了57.29%,这完全是通过迭代的、智能体驱动的数据适应(agent-driven data adaptation)实现的。通过揭示潜力与瓶颈,我们的研究将自主数据工程确立为一项可衡量的能力,并为面向智能体驱动的模型专业化(model specialization)指明了道路。代码将在 https://github.com/zjunlp/DataAgent 发布。
查看 arXiv 页面(https://arxiv.org/abs/2605.30407)查看 PDF(https://arxiv.org/pdf/2605.30407)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.30407)
在你的智能体中获取此论文:
hf papers read 2605.30407
没有最新的命令行界面?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型 0
没有模型链接到此论文
请在模型 README.md 中引用 arxiv.org/abs/2605.30407 以从此页面链接。
引用此论文的数据集 0
没有数据集链接到此论文
请在数据集 README.md 中引用 arxiv.org/abs/2605.30407 以从此页面链接。
引用此论文的 Space 0
没有 Space 链接到此论文
请在 Space README.md 中引用 arxiv.org/abs/2605.30407 以从此页面链接。
包含此论文的收藏集 0
没有收藏集包含此论文
请将此论文添加到收藏集(https://huggingface.co/new-collection)以从此页面链接。
相似文章
@victormustar: 在本周结束之前,让我们回顾一下开放AI领域最疯狂的一周,发布了超过25个引人注目的开放权重模型…
本周开放AI领域异常精彩,发布了超过25个开放权重模型,涵盖大语言模型、图像生成、音频/语音、视觉和视频/3D等领域,NVIDIA、Google等机构贡献突出。
2026年5月AI最新消息发布
谷歌在2026年5月宣布了重大AI更新,包括Gemini 3.5模型、用于多模态生成的Gemini Omni,以及Googlebook、Fitbit Air和Google Health应用等新硬件和健康工具。
@mdancho84:这份277页的PDF揭示了大型语言模型的秘密。以下是内容概述:
一份277页的PDF指南,揭示大型语言模型的深刻见解,由Matt Dancho通过推特讨论串分享。
不敢尝试本地AI代理?这个代理会在行动前征询你的同意——而且完全在你的机器上运行
Alfard是一个本地AI代理,要求用户批准不可逆操作,解决了安全性和信任问题。它完全在用户机器上运行,管理诸如GitHub PR和Notion任务等事务。
@Jackywine: 今天 Anthropic 这篇文章,被所有人转发了 https://anthropic.com/institute/recursive-self-improvement… 但是只有真正去官网看的人才会体会到,这段动画的“恐怖感” 递归开始了
Anthropic's research article details the accelerating trend of AI systems taking over more of their own development, pointing toward recursive self-improvement. The article presents evidence and implications of AI's growing autonomy in software engineering and model training.