@_philschmid: 权重:https://huggingface.co/collections/google/gemma-4-qat-q4-0… 博客:https://blog.google/innovation-and-ai/techno…
摘要
Google 发布了 Gemma 4 模型,采用量化感知训练 (QAT) 并以 Q4_0 精度托管在 Hugging Face 上,提供从 5B 到 33B 参数的高效变体。
查看缓存全文
缓存时间: 2026/06/08 15:22
权重:https://huggingface.co/collections/google/gemma-4-qat-q4-0… 博客:https://blog.google/innovation-and-ai/technology/developers-tools/quantization-aware-training-gemma-4/…
Gemma 4 QAT Q4_0 - 一个 Google 合集
来源:https://huggingface.co/collections/google/gemma-4-qat-q4-0
- — #### google/gemma-4-E2B-it-qat-q4_0-unquantized 任意到任意 • 5B • 3天前更新 • 1.92k • 10 (https://huggingface.co/google/gemma-4-E2B-it-qat-q4_0-unquantized)
- — #### google/gemma-4-E4B-it-qat-q4_0-unquantized 任意到任意 • 8B • 3天前更新 • 1.39k • 6 (https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-unquantized)
- — #### google/gemma-4-12B-it-qat-q4_0-unquantized 任意到任意 • 12B • 3天前更新 • 4.52k • 32 (https://huggingface.co/google/gemma-4-12B-it-qat-q4_0-unquantized)
- — #### google/gemma-4-26B-A4B-it-qat-q4_0-unquantized 图像-文本到文本 • 27B • 3天前更新 • 1.61k • 16 (https://huggingface.co/google/gemma-4-26B-A4B-it-qat-q4_0-unquantized)
- — #### google/gemma-4-31B-it-qat-q4_0-unquantized 图像-文本到文本 • 33B • 3天前更新 • 1.81k • 13 (https://huggingface.co/google/gemma-4-31B-it-qat-q4_0-unquantized)
- — #### google/gemma-4-E2B-it-qat-q4_0-unquantized-assistant 任意到任意 • 78M • 3天前更新 • 158 • 4 (https://huggingface.co/google/gemma-4-E2B-it-qat-q4_0-unquantized-assistant)
- — #### google/gemma-4-E4B-it-qat-q4_0-unquantized-assistant 任意到任意 • 78.8M • 3天前更新 • 221 • 3 (https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-unquantized-assistant)
- — #### google/gemma-4-12B-it-qat-q4_0-unquantized-assistant 任意到任意 • 0.4B • 3天前更新 • 1.12k • 13 (https://huggingface.co/google/gemma-4-12B-it-qat-q4_0-unquantized-assistant)
- — #### google/gemma-4-26B-A4B-it-qat-q4_0-unquantized-assistant 图像-文本到文本 • 0.4B • 3天前更新 • 399 • 6 (https://huggingface.co/google/gemma-4-26B-A4B-it-qat-q4_0-unquantized-assistant)
- — #### google/gemma-4-31B-it-qat-q4_0-unquantized-assistant 图像-文本到文本 • 0.5B • 3天前更新 • 1.13k • 12 (https://huggingface.co/google/gemma-4-31B-it-qat-q4_0-unquantized-assistant)
- — #### google/gemma-4-E2B-it-qat-q4_0-gguf 任意到任意 • 5B • 3天前更新 • 9.57k • 26 (https://huggingface.co/google/gemma-4-E2B-it-qat-q4_0-gguf)
- — #### google/gemma-4-E4B-it-qat-q4_0-gguf 任意到任意 • 7B • 2天前更新 • 12.8k • 27 (https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-gguf)
- — #### google/gemma-4-12B-it-qat-q4_0-gguf 任意到任意 • 12B • 3天前更新 • 52.4k • 85 (https://huggingface.co/google/gemma-4-12B-it-qat-q4_0-gguf)
- — #### google/gemma-4-26B-A4B-it-qat-q4_0-gguf 图像-文本到文本 • 25B • 3天前更新 • 18.6k • 42 (https://huggingface.co/google/gemma-4-26B-A4B-it-qat-q4_0-gguf)
- — #### google/gemma-4-31B-it-qat-q4_0-gguf 图像-文本到文本 • 31B • 3天前更新 • 12.9k • 49 (https://huggingface.co/google/gemma-4-31B-it-qat-q4_0-gguf)
- — #### google/gemma-4-E2B-it-qat-w4a16-ct 任意到任意 • 6B • 3天前更新 • 2.81k • 3 (https://huggingface.co/google/gemma-4-E2B-it-qat-w4a16-ct)
- — #### google/gemma-4-E4B-it-qat-w4a16-ct 任意到任意 • 9B • 3天前更新 • 11.1k • 3 (https://huggingface.co/google/gemma-4-E4B-it-qat-w4a16-ct)
- — #### google/gemma-4-12B-it-qat-w4a16-ct 任意到任意 • 13B • 3天前更新 • 152k • 16 (https://huggingface.co/google/gemma-4-12B-it-qat-w4a16-ct)
- — #### google/gemma-4-31B-it-qat-w4a16-ct 图像-文本到文本 • 34B • 3天前更新 • 22.6k • 16 (https://huggingface.co/google/gemma-4-31B-it-qat-w4a16-ct)
相似文章
google/gemma-4-12B-it-qat-q4_0-gguf
Google DeepMind 发布了 Gemma 4 模型,这些模型通过量化感知训练(QAT)进行了优化,并提供包括 GGUF 在内的多种格式,在降低内存需求的同时实现了高质量。
Gemma 4 QAT模型:为移动和笔记本电脑效率优化压缩
谷歌发布采用量化感知训练(QAT)优化的Gemma 4模型,旨在提升移动和笔记本电脑部署的效率,将E2B模型的内存占用降至1GB,同时保持质量。
@TheAhmadOsman: 好消息,谷歌刚刚发布了其Gemma 4模型系列的QAT(4位)版本,包括31B Dense和26B MoE…
谷歌发布了其Gemma 4模型系列的QAT(4位)版本,包括31B Dense和26B MoE模型,进一步推动了开源AI。
Google 的量化感知训练 Gemma 检查点已在 HuggingFace 上发布,支持移动设备推理
Google 在 HuggingFace 上发布了经过量化感知训练的 Gemma 4 检查点,针对移动设备推理进行了优化,并提供 QAT Mobile 和 Q4_0 两种变体。
google/gemma-4-26B-A4B-it
Google DeepMind 发布 Gemma 4,一系列开放权重的多模态模型,参数量从2.3B到31B,支持文本、图像、视频和音频输入。模型具有256K上下文窗口,MoE和密集架构,增强的推理能力,并针对从移动设备到服务器的部署进行优化。