OpenDevin:一个将 AI 软件开发者作为通用代理的开放平台
摘要
OpenDevin 是一个开源平台,用于开发能够通过编写代码、使用命令行以及浏览网页来与环境互动的 AI 代理。该平台支持多种代理、沙箱化代码执行,以及 SWE-Bench 等评估基准。
查看缓存全文
缓存时间: 2026/05/08 08:44
论文页面 - OpenDevin:一个开放平台,让 AI 软件开发者作为通用智能体运行
来源:https://huggingface.co/papers/2407.16741
摘要
OpenDevin 是一个用于开发 AI 智能体的平台,这些智能体通过编写代码、使用命令行和浏览网页与世界进行交互,并支持多智能体协作和评估基准测试。
软件是我们人类手中最强大的工具之一;它使得熟练的程序员能够以复杂而深刻的方式与世界互动。同时,得益于大型语言模型(LLM)的进步,那些能够与环境互动并引发变化的 AI 智能体 (https://huggingface.co/papers?q=AI%20agents) 也迅速发展。在本文中,我们介绍了 OpenDevin (https://huggingface.co/papers?q=OpenDevin),这是一个用于开发强大且灵活的 AI 智能体 (https://huggingface.co/papers?q=AI%20agents) 的平台,这些智能体以类似人类开发者的方式与世界互动:通过编写代码、与命令行交互以及浏览网页。我们描述了该平台如何实现新智能体的实施、在沙盒环境 (https://huggingface.co/papers?q=sandboxed%20environments) 中安全地进行代码执行 (https://huggingface.co/papers?q=code%20execution)、多智能体之间的协调以及评估基准的整合。基于目前整合的基准,我们对 15 个具有挑战性的任务(包括软件工程(如 SWE-Bench (https://huggingface.co/papers?q=SWE-Bench))和网络浏览(如 WebArena (https://huggingface.co/papers?q=WebArena))等)上的智能体表现进行了评估。OpenDevin (https://huggingface.co/papers?q=OpenDevin) 采用宽松的 MIT 许可证发布,是一个涵盖学术界和工业界的社区项目,已有来自 160 多位贡献者的超过 1.3K 次贡献,并将持续改进。
查看 arXiv 页面 (https://arxiv.org/abs/2407.16741) 查看 PDF (https://arxiv.org/pdf/2407.16741) GitHub72.8k auto (https://github.com/opendevin/opendevin) 添加到收藏夹 (https://huggingface.co/login?next=%2Fpapers%2F2407.16741)
在你的智能体中获取这篇论文:
hf papers read 2407\.16741
还没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
没有模型链接此论文
在模型 README.md 中引用 arxiv.org/abs/2407.16741 即可从此页面链接。
引用此论文的数据集3
GloriaaaM/LLM-Agent-Harness-Survey 查看者• 更新于23天前 • 1 • 1.17k • 5 (https://huggingface.co/datasets/GloriaaaM/LLM-Agent-Harness-Survey)
namanvats/harbor-goose-openhands-benchmark 查看者• 更新于26天前 • 246 • 135 • 3 (https://huggingface.co/datasets/namanvats/harbor-goose-openhands-benchmark)
antieval/aware-bench-measure-logs (https://huggingface.co/datasets/antieval/aware-bench-measure-logs)
引用此论文的 Spaces0
没有 Space 链接此论文
在 Space 的 README.md 中引用 arxiv.org/abs/2407.16741 即可从此页面链接。
包含此论文的集合20
浏览包含此论文的20个集合 (https://huggingface.co/collections?paper=2407.16741)
相似文章
@dabit3: Devin 不仅仅是一个编码助手。它是一个覆盖整个 SDLC 的 AI 工程平台:→ 规划 → 构建 → 测试 → 发布 → 监控…
Devin 被定位为一个 AI 工程平台,覆盖整个软件开发生命周期,从规划到文档,并提供集成和功能以增强开发者体验。
Devin Desktop
Devin Desktop 允许用户从单一界面管理本地和云端AI代理集群。
我构建了一个用于创建和管理AI代理的开源平台(MIT许可,可免费自托管)
作者构建了一个开源、MIT许可的AI代理创建和管理平台,具备提供商无关支持、MCP集成、记忆、技能、定时触发器和看板功能,可通过Docker Compose部署。
@windsurf: 推出 Devin Desktop:下一代 Windsurf — 从统一界面管理本地和云端代理集群,支持任何ACP兼容代理…
Cognition 推出 Devin Desktop,这是一个统一界面,用于管理本地和云端 AI 代理集群,支持任何 ACP 兼容代理,并集成了 IDE。
@tom_doerr: 用于数据分析、插件和网页浏览的AI智能体 https://github.com/xlang-ai/OpenAgents…
OpenAgents 是一个开放平台,用于在日常生活中使用和托管语言智能体,提供数据分析、插件和网页浏览等智能体功能,并开放代码和演示。