@cjzafir: 我日常使用的模型:> Codex 5.5 high (fast) > Deepseek v4 pro via API > Kimi 2.6 via API 我正在微调的模型...

X AI KOLs Timeline 新闻

摘要

用户分享了一份日常使用的AI模型列表(Codex 5.5、Deepseek v4 pro、Kimi 2.6)以及用于微调的模型(Qwen 3.5系列、Gemma4 E4B、GPT-oss 20B),目标是微调小型语言模型(SLM)成为专家语言模型(ELM)。

我日常使用的模型: > Codex 5.5 high (fast) > Deepseek v4 pro via API > Kimi 2.6 via API 我正在微调的模型: > Qwen 3.5 9B > Qwen 3.5 4B(最爱) > Qwen 3.5 2B > Gemma4 E4B > GPT-oss 20B 我的用例:使用最先进的SoTA大语言模型来微调小型语言模型(SLM),使其成为专家语言模型(ELM)。最近没用Claude,它的会话和周限制太离谱了。
查看原文

相似文章

@yidabuilds: https://x.com/yidabuilds/status/2053409619641602286

X AI KOLs Timeline

作者对DeepSeek V4、Kimi K2.6、GLM-5.1和MiniMax M2.7四款国产AI模型进行了横向对比测试,分析了它们在成本、长上下文处理能力、编程稳定性及推理性能上的优劣,并给出了针对大文档分析、长程后台任务和批量内容生产的具体分流建议。

Open source battle: GLM vs Kimi vs MiMo vs DeepSeek

Reddit r/LocalLLaMA

本文测试了智谱GLM 5.1、月之暗面Kimi K2.6、阶跃星辰MIMO 2.5 Pro和深度求索DeepSeek V4 Pro四个开源中国AI模型在编程任务中的表现,发现GLM在多数任务中整体领先但非绝对,各模型各有优劣。