我们迫切需要一款80-160B的模型。统一内存设备市场需要更多模型。

Reddit r/LocalLLaMA 2026/06/17 19:55 新闻

unified-memory large-language-models model-demand hardware-limitations sparse-models apple-silicon amd-ai

摘要

作者认为，当前迫切需要80-160B参数范围的AI模型，以支持使用统一内存设备的用户（例如高内存的Apple/AMD系统），因为最近的模型对于他们的硬件来说要么太小，要么太大。

大家好，我就长话短说了。有很多人拥有大量但不够快的“慢”内存。任何拥有96GB以上Apple设备的人、任何拥有96GB以上Ryzen AI 395设备的人、任何拥有DGX Spark的人，甚至拥有RTX 6000 Pro或4x3090或其他配置的人。或者拥有128GB DDR4/5内存的人。然而，最近三个月发布的模型要么是为高速低容量机器设计的（27B Qwen、31B Gemma），要么是另一个极端的大型模型（GLM 5.2、Deepseek V4 Pro、Kimi 2.7、Mimo 2.5 Pro、MiniMax M3）。我们这些使用统一内存设备或其他80-128GB配置的人，要么不得不使用较旧的模型，但那些模型目前并不出色，因为前沿已经扩展了（GLM 4.5 Air、GPT OSS 120B、Qwen 3.5 122B、Nemotron 3 Super 120B、Qwen 3 Coder Next 80B）；要么由于内存带宽慢而不得不在RAM/VRAM上使用小模型（Qwen 3.6 35B或Gemma 4 26B）。我们需要一些在100B 10B稀疏范围内的模型。一些拥有AMD 9700 AI Pro或Rtx 3090/5090以及64GB显存的人可以使用的模型。一些DGX Spark用户、Ai395+用户、Apple用户等可以使用的模型。比如类似Gpt OSS 120B V2、Gemma 4 122B、Qwen 3.6/3.7 122B、GLM 5.2 Air、Deepseek V4 Mini 100B、Mimo 2.5 Mini 100B或任何类似级别的模型。甚至Qwen 3.6 Coder 80B也会是大家喜欢的。我真的希望能得到一些这样的模型——否则我现在只能用Spark上的Qwen 3.5 122B了。谢谢。

查看原文