@lucastech: 真的很酷,看到gpt-oss-20b与我测试过的所有其他模型相比有多大的不同,每种量化都显著…
摘要
GPT-OSS-20B模型在量化过程中展现出显著的智能提升,同时保持相似大小,与其他模型不同。
查看缓存全文
缓存时间: 2026/05/30 20:45
看到gpt-oss-20b和我测试过的其他模型相比差别这么大,真的很酷,每种量化版本都明显更聪明,但大小几乎一样。大多数其他模型虽然变大了,但智能程度提升不大。https://t.co/QEciSdOexn
相似文章
@hank_aibtc: 家人们,本地 LLM太香了! 刷到 Hugging Face 上这个 gpt-oss-20b-tq3,真的有点上头! OpenAI 官方开源的 20B+ 参数 MoE 模型,被社区用 TurboQuant 3-bit 量化 + MLX 优…
The article highlights the gpt-oss-20b-tq3 model, a quantized version of an OpenAI MoE model that runs efficiently on standard 16GB MacBook Airs using TurboQuant and MLX optimizations.
@populartourist: Qwen3.6 27B 和 35B-A3B 是出色的模型,但目前还没有任何模型能达到GPT-OSS的效率。Qwen3.6 35B-A3B 与…
一条推文比较了Qwen3.6 27B和35B-A3B模型与GPT-OSS,指出虽然Qwen模型很快,但GPT-OSS更高效,尤其是在预填充性能方面。
@witcheer: 难以置信 gpt-oss-20b 在 8GB 显存上的表现。21B 总参数,3.6B 活跃参数(MoE)。OpenAI,Apache 2.0。仅使用 1.8 GB 显存…
一个全新的开源 MoE 模型,gpt-oss-20b(总共 21B,活跃 3.6B),仅需 1.8GB 显存即可运行,并在代理编程任务上获得满分,性能优于其他本地模型(如 Gemma 和 Qwen)。
推出 gpt-oss
OpenAI 发布 gpt-oss-120b 和 gpt-oss-20b,两款最先进的开放权重语言模型,采用 Apache 2.0 许可证,性能与专有模型相当,可针对消费级硬件和边缘设备进行优化。两款模型均展现出强大的推理和工具使用能力,并进行了全面的安全评估。
一些测试不同Gemma和Qwen量化版本准确性的对比实验
一位用户分享了针对不同量化版本的Gemma和Qwen模型在算术、总统出生日期和注意力测试中的准确率对比基准结果,强调了模型规模与量化级别之间的权衡。