schema-guided-agent

#schema-guided-agent

Dialogue SWE-Bench：对话驱动编码代理的基准测试

arXiv cs.CL ↗ · 昨天缓存

提出了 Dialogue-SWE-Bench，这是一个用于评估编码代理通过与用户对话解决软件工程问题能力的基准测试。该研究还提出了一种基于角色设定的用户模拟器和一个能够提升对话能力的模式引导型代理。

0 人收藏 0 人点赞