我们身在何处:一年之间,天地翻覆——Kimi、Minimax、Qwen、Gemma、GLM
摘要
作者感慨本地 AI 能力进步神速,如今借助 Qwen 27b、Minimax 2.7 等模型,在平价硬件上就能完成过去只有顶级云端大模型才能搞定的任务。
我知道 benchmark 常被诟病,对单个用例不精准,LLM 也常被“刷榜”……但今天我们聊的不是数字,而是趋势。当初用 GPT-4o 或 Sonnet 3.7 时,要是有人告诉我这么短时间内就能本地搞定同样的事,我绝对不信。如今却成真了——而且不需要 400GB 显存的怪兽卡,平价硬件也能跑。如果 Qwen 3.6 27b 真的很快发布,那将堪称炸裂。诚然,开源许可证在收紧,开发者越来越需要变现,但这依旧是最好的时代。昨天我用奇怪的 Qwen 27b + Minimax 2.7 Q4 组合,就完成了平时非得靠 Claude 才能搞定的任务。想要 GLM 5 Air 的朋友……不妨重新捡起 4.7,依旧能打,体积更小。这张图,回答了社区里我每天看到的无数疑问。
相似文章
@rohanpaul_ai: Qwen 3.7 Max 在编码和智能代理能力方面非常接近前沿模型。而且它现在已经在AI/ML API上可用。
Qwen 3.7 Max,Qwen 推出的新AI模型,现已通过AI/ML API提供,展现出接近GPT-5.4和Gemini 3.5 Flash等前沿模型的编码和智能代理能力。提供免费促销代码供用户试用。
无GPU革命:高效AI模型如何让人工智能大众化
一场静默的革命正在让强大的AI模型无需昂贵GPU即可在消费级硬件上运行,这得益于量化技术和优化实现(如llama.cpp的Gemma4 MTP支持)的突破,为爱好者、小型企业和边缘计算打开了大门。
@cjzafir: 我日常使用的模型:> Codex 5.5 high (fast) > Deepseek v4 pro via API > Kimi 2.6 via API 我正在微调的模型...
用户分享了一份日常使用的AI模型列表(Codex 5.5、Deepseek v4 pro、Kimi 2.6)以及用于微调的模型(Qwen 3.5系列、Gemma4 E4B、GPT-oss 20B),目标是微调小型语言模型(SLM)成为专家语言模型(ELM)。
Gemma 4:同等参数规模下能力最强的开源模型
Google DeepMind 发布 Gemma 4,这是其迄今为止能力最强的开源模型系列,专为高级推理和智能体工作流设计,在多种参数规模下均实现了极高的智能密度。
推出 Gemma 3
Google 推出了 Gemma 3,这是一套轻量级开源模型集合(1B、4B、12B、27B),设计用于在单个 GPU 或 TPU 上运行,支持 140+ 种语言、128k 上下文窗口和多模态功能。这些模型在保持高效性能的同时,性能超越了 Llama 3 和 DeepSeek-V3 等更大的竞品,适合边缘设备部署。