AutoDev:自动化 AI 驱动开发
摘要
AutoDev 是一个由 AI 驱动的软件开框架,能够在安全的 Docker 环境中自动化执行复杂的工程任务,例如代码和测试生成。它通过实现复杂软件工程任务的自主规划和执行,在 HumanEval 数据集上取得了高性能表现。
查看缓存全文
缓存时间: 2026/05/08 08:45
论文页面 - AutoDev:自动化 AI 驱动的开发
来源:https://huggingface.co/papers/2403.08299 发布于 2024年3月13日
摘要
AutoDev 是一个 AI 驱动的软件开发框架,在安全的 Docker 环境中自动化复杂的工程任务,在代码生成和测试生成方面取得了高性能。
随着 GitHub Copilot 等 AI 辅助工具的兴起,软件开发领域经历了范式转变。然而,现有解决方案并未充分利用 IDE 中可用的所有潜在功能,如构建、测试、执行代码、Git 操作等。因此,它们的能力受到限制,主要侧重于在基于聊天的界面中建议代码片段和操作文件。为了填补这一空白,我们提出了 AutoDev,一个完全自动化的 AI 驱动软件开发框架,旨在自主规划和执行复杂的软件工程任务。AutoDev 允许用户定义复杂的软件工程目标,并将这些目标分配给 AutoDev 的自主 AI 代理(https://huggingface.co/papers?q=autonomous%20AI%20Agents)来实现。这些 AI 代理可以对代码库执行多种操作,包括文件编辑、检索、构建过程、执行、测试和 Git 操作。它们还可以访问文件、编译器输出、构建和测试日志、静态分析工具等。这使得 AI 代理能够以完全自动化的方式执行任务,并全面理解所需的上下文信息。此外,AutoDev 通过将所有操作限制在 Docker 容器(https://huggingface.co/papers?q=Docker%20containers)中,建立了安全的发展环境。该框架结合了护栏以确保用户隐私和文件安全,允许用户在 AutoDev 中定义特定的允许或受限命令和操作。在我们的评估中,我们在 HumanEval 数据集(https://huggingface.co/papers?q=HumanEval%20dataset)上测试了 AutoDev,在代码生成(https://huggingface.co/papers?q=code%20generation)和测试生成(https://huggingface.co/papers?q=test%20generation)方面分别取得了 91.5% 和 87.8% 的 Pass@1(https://huggingface.co/papers?q=Pass%401),展示了其在自动化软件工程任务方面的有效性,同时保持安全且用户可控的开发环境。
查看 arXiv 页面(https://arxiv.org/abs/2403.08299)查看 PDF(https://arxiv.org/pdf/2403.08299)GitHub16.6k自动(https://github.com/vxcontrol/pentagi)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2403.08299)
在您的代理中获取此论文:
hf papers read 2403\.08299
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型 0
没有模型链接此论文
在模型 README.md 中引用 arxiv.org/abs/2403.08299 以从此页面链接它。
引用此论文的数据集 0
没有数据集链接此论文
在数据集 README.md 中引用 arxiv.org/abs/2403.08299 以从此页面链接它。
引用此论文的 Spaces 0
没有 Space 链接此论文
在 Space README.md 中引用 arxiv.org/abs/2403.08299 以从此页面链接它。
包含此论文的收藏集 4
相似文章
AutoScout24 利用 AI 驱动的工作流实现工程扩展
AutoScort24 在其工程团队及更广泛的员工群体中部署了 OpenAI 的 Codex 和 ChatGPT,大幅缩短了开发周期并提升了代码质量。
@tom_doerr: 将AI编码聊天转化为可重复的工程工作流 https://github.com/codeaholicguy/ai-devkit…
AI DevKit 是一个工具,它为 AI 编码代理添加了结构化的工程工作流,包括需求、设计、验证和记忆,从而用可重复的流程取代一次性聊天。
我的家庭实验室AI开发平台
作者描述如何在家庭实验室中搭建一个AI开发平台,使用带有Git访问权限的OpenCode Web UI,通过PR审查和GitOps部署实现对Docker服务的AI辅助维护。
OpenDevin:一个将 AI 软件开发者作为通用代理的开放平台
OpenDevin 是一个开源平台,用于开发能够通过编写代码、使用命令行以及浏览网页来与环境互动的 AI 代理。该平台支持多种代理、沙箱化代码执行,以及 SWE-Bench 等评估基准。
@tom_doerr: 用14个专业AI代理运营虚拟公司 https://github.com/MaxMiksa/Auto-Company…
Auto-Company 是一个开源项目,它协调14个自主AI代理,实现24/7全自动化公司运营,涵盖构思、编码、部署和市场营销,无需人工干预,由Claude Code和Codex CLI驱动。