@cjzafir: 我日常使用的模型:> Codex 5.5 high (fast) > Deepseek v4 pro via API > Kimi 2.6 via API 我正在微调的模型...
摘要
用户分享了一份日常使用的AI模型列表(Codex 5.5、Deepseek v4 pro、Kimi 2.6)以及用于微调的模型(Qwen 3.5系列、Gemma4 E4B、GPT-oss 20B),目标是微调小型语言模型(SLM)成为专家语言模型(ELM)。
我日常使用的模型:
> Codex 5.5 high (fast)
> Deepseek v4 pro via API
> Kimi 2.6 via API
我正在微调的模型:
> Qwen 3.5 9B
> Qwen 3.5 4B(最爱)
> Qwen 3.5 2B
> Gemma4 E4B
> GPT-oss 20B
我的用例:使用最先进的SoTA大语言模型来微调小型语言模型(SLM),使其成为专家语言模型(ELM)。最近没用Claude,它的会话和周限制太离谱了。
相似文章
@cjzafir:Qwen 3.5 4B 和 8B 模型太棒了。我今天微调了一个 4B 模型,在全精度和 Q8 量化版本上达到了 98% 的准确率…
一位开发者报告称,使用 Unsloth 微调 Qwen 3.5 4B 和 8B 模型后取得了高准确率,这表明业界正转向针对细分任务使用专用的专家语言模型(ELMs)。
@0xSero:DeepSeek-V4-Pro 和 Kimi-K2.6 正在 Codex 应用中运行。体验前沿技术最经济的方式。支持本地模型,并且它们可以……
Codex 应用现已支持 DeepSeek-V4-Pro 和 Kimi-K2.6,提供使用前沿 AI 模型的最经济方式,同时支持本地模型和计算机使用功能。
@yidabuilds: https://x.com/yidabuilds/status/2053409619641602286
作者对DeepSeek V4、Kimi K2.6、GLM-5.1和MiniMax M2.7四款国产AI模型进行了横向对比测试,分析了它们在成本、长上下文处理能力、编程稳定性及推理性能上的优劣,并给出了针对大文档分析、长程后台任务和批量内容生产的具体分流建议。
我们身在何处:一年之间,天地翻覆——Kimi、Minimax、Qwen、Gemma、GLM
作者感慨本地 AI 能力进步神速,如今借助 Qwen 27b、Minimax 2.7 等模型,在平价硬件上就能完成过去只有顶级云端大模型才能搞定的任务。
Open source battle: GLM vs Kimi vs MiMo vs DeepSeek
本文测试了智谱GLM 5.1、月之暗面Kimi K2.6、阶跃星辰MIMO 2.5 Pro和深度求索DeepSeek V4 Pro四个开源中国AI模型在编程任务中的表现,发现GLM在多数任务中整体领先但非绝对,各模型各有优劣。