OpenDevin:一个将 AI 软件开发者作为通用代理的开放平台

Papers with Code Trending 工具

摘要

OpenDevin 是一个开源平台,用于开发能够通过编写代码、使用命令行以及浏览网页来与环境互动的 AI 代理。该平台支持多种代理、沙箱化代码执行,以及 SWE-Bench 等评估基准。

软件是人类手中最强大的工具之一;它让熟练的程序员能够以复杂且深刻的方式与世界互动。与此同时,得益于大型语言模型(LLM)的进步,能够与周围环境互动并产生影响的人工智能代理也得到了快速发展。在本文中,我们介绍了 OpenDevin,这是一个用于开发强大且灵活的 AI 代理的平台,这些代理能以与人类开发者相似的方式与世界互动:通过编写代码、与命令行互动以及浏览网页。我们描述了该平台如何支持新代理的实现、在沙箱环境中安全执行代码、多个代理之间的协调,以及评估基准的整合。基于我们目前整合的基准,我们对 15 项具有挑战性的任务进行了代理评估,其中包括软件工程(例如 SWE-Bench)和网页浏览(例如 WebArena)等任务。OpenDevin 基于宽松的 MIT 许可证发布,是一个跨越学术界与工业界的社区项目,目前已有超过 160 位贡献者提交了 1.3 万余次贡献,并将持续改进。
查看原文
查看缓存全文

缓存时间: 2026/05/08 08:44

论文页面 - OpenDevin:一个开放平台,让 AI 软件开发者作为通用智能体运行

来源:https://huggingface.co/papers/2407.16741

摘要

OpenDevin 是一个用于开发 AI 智能体的平台,这些智能体通过编写代码、使用命令行和浏览网页与世界进行交互,并支持多智能体协作和评估基准测试。

软件是我们人类手中最强大的工具之一;它使得熟练的程序员能够以复杂而深刻的方式与世界互动。同时,得益于大型语言模型(LLM)的进步,那些能够与环境互动并引发变化的 AI 智能体 (https://huggingface.co/papers?q=AI%20agents) 也迅速发展。在本文中,我们介绍了 OpenDevin (https://huggingface.co/papers?q=OpenDevin),这是一个用于开发强大且灵活的 AI 智能体 (https://huggingface.co/papers?q=AI%20agents) 的平台,这些智能体以类似人类开发者的方式与世界互动:通过编写代码、与命令行交互以及浏览网页。我们描述了该平台如何实现新智能体的实施、在沙盒环境 (https://huggingface.co/papers?q=sandboxed%20environments) 中安全地进行代码执行 (https://huggingface.co/papers?q=code%20execution)、多智能体之间的协调以及评估基准的整合。基于目前整合的基准,我们对 15 个具有挑战性的任务(包括软件工程(如 SWE-Bench (https://huggingface.co/papers?q=SWE-Bench))和网络浏览(如 WebArena (https://huggingface.co/papers?q=WebArena))等)上的智能体表现进行了评估。OpenDevin (https://huggingface.co/papers?q=OpenDevin) 采用宽松的 MIT 许可证发布,是一个涵盖学术界和工业界的社区项目,已有来自 160 多位贡献者的超过 1.3K 次贡献,并将持续改进。

查看 arXiv 页面 (https://arxiv.org/abs/2407.16741) 查看 PDF (https://arxiv.org/pdf/2407.16741) GitHub72.8k auto (https://github.com/opendevin/opendevin) 添加到收藏夹 (https://huggingface.co/login?next=%2Fpapers%2F2407.16741)

在你的智能体中获取这篇论文:

hf papers read 2407\.16741

还没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2407.16741 即可从此页面链接。

引用此论文的数据集3

GloriaaaM/LLM-Agent-Harness-Survey 查看者• 更新于23天前 • 1 • 1.17k • 5 (https://huggingface.co/datasets/GloriaaaM/LLM-Agent-Harness-Survey)

namanvats/harbor-goose-openhands-benchmark 查看者• 更新于26天前 • 246 • 135 • 3 (https://huggingface.co/datasets/namanvats/harbor-goose-openhands-benchmark)

antieval/aware-bench-measure-logs (https://huggingface.co/datasets/antieval/aware-bench-measure-logs)

引用此论文的 Spaces0

没有 Space 链接此论文

在 Space 的 README.md 中引用 arxiv.org/abs/2407.16741 即可从此页面链接。

包含此论文的集合20

浏览包含此论文的20个集合 (https://huggingface.co/collections?paper=2407.16741)

相似文章

Devin Desktop

Product Hunt

Devin Desktop 允许用户从单一界面管理本地和云端AI代理集群。