@DJLougen: 自豪地介绍一个全新的27B后训练模型 在同时被Fable和Kimi 2.7 Coder所打动之后,我想看看…
摘要
介绍了一个新的27B后训练模型,该模型从Fable和Kimi 2.7 Coder中提炼优点,并附有下载链接。
查看缓存全文
缓存时间: 2026/06/21 04:32
自豪地推出一款新的27B后训练模型 在Fable和Kimi 2.7 Coder都给我留下深刻印象之后,我想看看能从两者中提取出多少优点,我想你们都会满意的! 链接如下!https://t.co/G7szTR9GmV
相似文章
Kimi 2.7 代码模型发布并开源,Kimi 最新编码模型
Kimi 发布并开源了 Kimi 2.7 Code,这是一款性能提升、减少推理 token 数量并具备长时编码能力的编码模型。
Kimi K2.7 Code 务实胜过炫技
Kimi 发布了 K2.7 Code,这是一款专注于编程的 AI 模型,其基准测试成绩提升,且思考令牌使用量降低 30%。它更强调在长代码循环和智能体工具集成中的实际性能,而非炫目的分数。
@rasbt: 疯狂模型!它实际上使用了旧的Qwen2.5-Coder-3B栈,并通过后训练取得了非常出色的性能……
一个使用Qwen2.5-Coder-3B栈的3B参数模型,在编程基准测试中取得了与Claude Opus 4.5相媲美的分数,采用了详细的后训练技术,包括合成数据、过滤、两阶段SFT,以及一种新颖的RL方法(MGPO)。
@cjzafir: 我日常使用的模型:> Codex 5.5 high (fast) > Deepseek v4 pro via API > Kimi 2.6 via API 我正在微调的模型...
用户分享了一份日常使用的AI模型列表(Codex 5.5、Deepseek v4 pro、Kimi 2.6)以及用于微调的模型(Qwen 3.5系列、Gemma4 E4B、GPT-oss 20B),目标是微调小型语言模型(SLM)成为专家语言模型(ELM)。
@HuggingPapers: LoopCoder-v2 已发布。一个基于 18T token 训练的 7B 模型,仅用两次循环就在 SWE-bench Verified 上取得了 64.4 的高分,击败了...
LoopCoder-v2 是一个基于 18T token 训练的 7B 模型,仅用两次循环就在 SWE-bench Verified 上取得了 64.4 的成绩,性能超越 30 倍参数规模的模型。模型和代码已在 Hugging Face 上开源。