为什么缺乏新的100B-120B模型?

Reddit r/LocalLLaMA 新闻

摘要

分析AI模型尺寸趋势,指出100-120B参数范围存在空白,近期发布主要聚焦于较小(25-35B)或较大(200B+)的模型。

GPT-OSS-120B 是该系列的首个模型,之后有 GLM-4.5-Air、Nemotron-3-Super、Qwen3.5-122B、Mistral-Small-4-119B。然而,所有这些模型至少已有3个月历史(GPT-OSS-120B 已10个月),而所有最新发布要么是25B-35B(Gemma4, Qwen3.6),要么是200B+(Step 3.5/3.7 Flash, DeepSeek-V4-Flash, MiniMax-M3, Nemotron-3-Ultra)。~120B MoE系列是否像70B/80B系列一样“消亡”了,还是说2026年下半年可能会有新发布?
查看原文

相似文章