AutoDev:自动化 AI 驱动开发

Papers with Code Trending 论文

摘要

AutoDev 是一个由 AI 驱动的软件开框架,能够在安全的 Docker 环境中自动化执行复杂的工程任务,例如代码和测试生成。它通过实现复杂软件工程任务的自主规划和执行,在 HumanEval 数据集上取得了高性能表现。

随着以 GitHub Copilot 为代表的 AI 辅助工具的兴起,软件开发领域经历了一场范式转变。然而,现有解决方案并未充分利用 IDE 中可用的所有潜在能力,例如构建、测试、代码执行和 git 操作等。因此,它们的能力受到限制,主要集中在通过基于聊天的界面提供代码片段建议和文件操作。为了填补这一空白,我们提出了 AutoDev,这是一个全自动的 AI 驱动软件开发框架,旨在自主规划和执行复杂的软件工程任务。AutoDev 允许用户定义复杂的软件工程目标,并将其分配给 AutoDev 的自主 AI 代理(Agents)去完成。这些 AI 代理可以对代码库执行多种操作,包括文件编辑、检索、构建流程、执行、测试和 git 操作。它们还可以访问文件、编译器输出、构建和测试日志、静态分析工具等。这使得 AI 代理能够在全面理解所需上下文信息的情况下,以完全自动化的方式执行任务。此外,AutoDev 通过将所有操作限制在 Docker 容器内,建立了一个安全的开发环境。该框架融入了护栏机制,以确保用户隐私和文件安全,允许用户在 AutoDev 中定义特定的允许或受限命令和操作。在我们的评估中,我们在 HumanEval 数据集上测试了 AutoDev,取得了令人鼓舞的结果:代码生成和测试生成的 Pass@1 率分别为 91.5% 和 87.8%,证明了其在自动化软件工程任务方面的有效性,同时保持了安全且由用户控制的开发环境。
查看原文
查看缓存全文

缓存时间: 2026/05/08 08:45

论文页面 - AutoDev:自动化 AI 驱动的开发

来源:https://huggingface.co/papers/2403.08299 发布于 2024年3月13日

摘要

AutoDev 是一个 AI 驱动的软件开发框架,在安全的 Docker 环境中自动化复杂的工程任务,在代码生成和测试生成方面取得了高性能。

随着 GitHub Copilot 等 AI 辅助工具的兴起,软件开发领域经历了范式转变。然而,现有解决方案并未充分利用 IDE 中可用的所有潜在功能,如构建、测试、执行代码、Git 操作等。因此,它们的能力受到限制,主要侧重于在基于聊天的界面中建议代码片段和操作文件。为了填补这一空白,我们提出了 AutoDev,一个完全自动化的 AI 驱动软件开发框架,旨在自主规划和执行复杂的软件工程任务。AutoDev 允许用户定义复杂的软件工程目标,并将这些目标分配给 AutoDev 的自主 AI 代理(https://huggingface.co/papers?q=autonomous%20AI%20Agents)来实现。这些 AI 代理可以对代码库执行多种操作,包括文件编辑、检索、构建过程、执行、测试和 Git 操作。它们还可以访问文件、编译器输出、构建和测试日志、静态分析工具等。这使得 AI 代理能够以完全自动化的方式执行任务,并全面理解所需的上下文信息。此外,AutoDev 通过将所有操作限制在 Docker 容器(https://huggingface.co/papers?q=Docker%20containers)中,建立了安全的发展环境。该框架结合了护栏以确保用户隐私和文件安全,允许用户在 AutoDev 中定义特定的允许或受限命令和操作。在我们的评估中,我们在 HumanEval 数据集(https://huggingface.co/papers?q=HumanEval%20dataset)上测试了 AutoDev,在代码生成(https://huggingface.co/papers?q=code%20generation)和测试生成(https://huggingface.co/papers?q=test%20generation)方面分别取得了 91.5% 和 87.8% 的 Pass@1(https://huggingface.co/papers?q=Pass%401),展示了其在自动化软件工程任务方面的有效性,同时保持安全且用户可控的开发环境。

查看 arXiv 页面(https://arxiv.org/abs/2403.08299)查看 PDF(https://arxiv.org/pdf/2403.08299)GitHub16.6k自动(https://github.com/vxcontrol/pentagi)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2403.08299)

在您的代理中获取此论文:

hf papers read 2403\.08299

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型 0

没有模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2403.08299 以从此页面链接它。

引用此论文的数据集 0

没有数据集链接此论文

在数据集 README.md 中引用 arxiv.org/abs/2403.08299 以从此页面链接它。

引用此论文的 Spaces 0

没有 Space 链接此论文

在 Space README.md 中引用 arxiv.org/abs/2403.08299 以从此页面链接它。

包含此论文的收藏集 4

相似文章

我的家庭实验室AI开发平台

Hacker News Top

作者描述如何在家庭实验室中搭建一个AI开发平台,使用带有Git访问权限的OpenCode Web UI,通过PR审查和GitOps部署实现对Docker服务的AI辅助维护。