schema-guided-agent

标签

Cards List
#schema-guided-agent

Dialogue SWE-Bench:对话驱动编码代理的基准测试

arXiv cs.CL · 23小时前 缓存

提出了 Dialogue-SWE-Bench,这是一个用于评估编码代理通过与用户对话解决软件工程问题能力的基准测试。该研究还提出了一种基于角色设定的用户模拟器和一个能够提升对话能力的模式引导型代理。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈