programming-benchmarks

标签

Cards List
#programming-benchmarks

Vibe Coding 吃掉了我的作业:对AI方法在新建软件工程与编程中的评估

arXiv cs.AI · 5天前 缓存

本文评估了‘vibe coding’(即使用自然语言提示通过AI智能体生成代码而无需人工审查)在新建软件工程任务中的可行性,并分析了现有用于衡量LLM编程能力的基准测试。作者开发了一套针对简单Python编程任务的评估套件,以提供有针对性的见解。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈