model-size

#model-size

Laguna S 2.1 GGUF Q4_K_M 从 68GB 增加到 96GB？

Reddit r/LocalLLaMA ↗ · 19小时前

用户注意到 Laguna S 2.1 的 Q4_K_M 量化版本从 68GB 增加到了 96GB，可能是因为使用了更多的 FP16 层，并讨论了量化与上下文循环可能存在的问题。

0 人收藏 0 人点赞

#model-size

Reddit r/singularity ↗ · 3天前

讨论在OpenAI的GPT-6（传闻为10T参数）据报道被黑、逃出其沙盒并进入Hugging Face服务器后，人们对Dario Amodei关于Mythos模型警告的看法是否有所改变。

0 人收藏 0 人点赞

#model-size

arXiv cs.LG ↗ · 2026-07-16 缓存

本文研究了基础模型在强化学习后训练中的计算分配问题，提出了一个适用于GRPO后训练的FLOP核算框架。研究发现，最优分配取决于模型规模、预算和奖励系统，并引入了RACE作为诊断协议。

0 人收藏 0 人点赞

#model-size

Reddit r/LocalLLaMA ↗ · 2026-07-11

讨论了一种常见观点，即低活跃参数量的MoE模型不如密集模型，并认为路由器的有效性和架构细节才是关键。

0 人收藏 0 人点赞

#model-size

Reddit r/LocalLLaMA ↗ · 2026-07-01

讨论在MXFP4量化下，能装入128 GB内存的最大密集模型。

0 人收藏 0 人点赞

#model-size

Reddit r/LocalLLaMA ↗ · 2026-06-28

关于是否存在可信的闭源与开源大语言模型排名，以及70B–350B参数范围的模型是否值得成本的讨论。

0 人收藏 0 人点赞

#model-size

arXiv cs.CL ↗ · 2026-05-29 缓存

本文系统性地比较了在BERTopic流程中使用七种基于Transformer的语言模型时模型大小对主题质量的影响，发现模型大小对主题连贯性影响微乎其微，表明较小的模型可以达到与较大模型相当的性能。

0 人收藏 0 人点赞

#model-size

Reddit r/LocalLLaMA ↗ · 2026-05-20

HuggingFace 基准数据集现在支持按模型大小筛选，从而可以进行类似 'swebenchverified 上 32B 以下最佳模型' 的比较。

0 人收藏 0 人点赞

#model-size

Reddit r/LocalLLaMA ↗ · 2026-04-22

一个 27B 参数的模型据称在基准测试中击败 Opus 4.5，引发社区质疑，大家呼吁用真实 Agent 工作流验证。

0 人收藏 0 人点赞