@HuggingPapers: LoopCoder-v2 已发布。一个基于 18T token 训练的 7B 模型,仅用两次循环就在 SWE-bench Verified 上取得了 64.4 的高分,击败了...

X AI KOLs Following 模型

摘要

LoopCoder-v2 是一个基于 18T token 训练的 7B 模型,仅用两次循环就在 SWE-bench Verified 上取得了 64.4 的成绩,性能超越 30 倍参数规模的模型。模型和代码已在 Hugging Face 上开源。

LoopCoder-v2 已发布 一个基于 18T token 训练的 7B 模型,仅用两次循环就在 SWE-bench Verified 上取得了 64.4 的高分,击败了 30 倍参数规模的模型。 添加第三次循环反而导致性能下降。 模型和代码已在 Hugging Face 上发布。https://t.co/nyHlt7suMB
查看原文
查看缓存全文

缓存时间: 2026/06/17 13:54

LoopCoder-v2 已发布

一个在18T token上训练的7B模型,仅用两个循环就在SWE-bench Verified上取得了64.4分,击败了30倍大的模型。

添加第三个循环反而效果更差。

模型和代码已在Hugging Face上发布。 https://t.co/nyHlt7suMB

相似文章

Multilingual-Multimodal-NLP/LoopCoder-V2 · Hugging Face

Reddit r/LocalLLaMA

LoopCoder-V2 是一个基于 Parallel Loop Transformer (PLT) 构建的 7B 参数指令调优代码模型,展示了非单调测试时扩展特性,其中两个循环提供了最佳的收益-成本权衡,并在代码生成和推理基准测试上显著优于基线模型。