@ollama: GLM 5.2在Ollama的云上刚刚将GPU容量翻倍以应对使用量！这一切都基于美国，运行在…

X AI KOLs Following 2026/06/18 22:06 产品

glm-5-2 ollama gpu-capacity nvidia-b300 blackwell open-models privacy

摘要

Ollama在其美国云上为GLM 5.2将GPU容量翻倍，使用NVIDIA B300 Blackwell GPU，强调隐私和开放模型。

GLM 5.2在Ollama的云上刚刚将GPU容量翻倍以应对使用量！这一切都基于美国，并在NVIDIA B300 Blackwell GPU上运行。我们相信隐私很重要！支持开放模型！❤️

查看原文

查看缓存全文

缓存时间: 2026/06/20 22:24

GLM 5.2 on Ollama’s cloud 刚刚将GPU容量翻倍以应对使用量！

这一切都基于美国，运行在NVIDIA B300 Blackwell GPU上。我们相信隐私至关重要！

支持开源模型！❤️

相似文章

Reddit r/LocalLLaMA

一位用户仅用CPU在本地运行GLM-5.2，演示如何在简陋的配置上运行大型模型。

Reddit r/LocalLLaMA

GLM 5.2 已发布，采用 MIT 许可协议在 HuggingFace 上开放权重，可通过 API 和 Ollama 获取，其基准测试结果具有竞争力，仅落后 Opus 4.8 一个点，领先 GPT-5.5 一个点。

X AI KOLs Following

一套现成的Docker配置，用于在4块RTX PRO 6000 Blackwell GPU上通过vLLM部署GLM-5.2-NVFP4-REAP-469B模型，包含详细说明和配置选项。

X AI KOLs Timeline

UnslothAI 宣布 GLM-5.2，Z.ai 的最强开源模型，拥有 744B 参数，现在可以通过动态 GGUF 量化在本地运行，将大小减少约 84% 至 239GB，同时保留约 82% 的准确率。它适用于 256GB Mac 以及 RAM/VRAM 配置，并支持长上下文、推理和代理任务。

X AI KOLs Timeline

AirLLM是一个开源工具，优化推理内存使用，无需量化即可在单个4GB GPU上运行70B大语言模型，并支持在8GB显存上运行405B模型。