code-evaluation

标签

Cards List
#code-evaluation

CodeAlchemy:大规模合成代码重写

arXiv cs.CL · 2026-06-10 缓存

CodeAlchemy 是一个合成数据生成框架,通过五种策略将公开可用的代码转换为语义丰富的训练数据,生成超过5000亿个 token,使得小型模型在代码基准测试上超越大得多的模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈