@_philschmid: 权重:https://huggingface.co/collections/google/gemma-4-qat-q4-0… 博客:https://blog.google/innovation-and-ai/techno…

X AI KOLs Following 模型

摘要

Google 发布了 Gemma 4 模型,采用量化感知训练 (QAT) 并以 Q4_0 精度托管在 Hugging Face 上,提供从 5B 到 33B 参数的高效变体。

权重:https://huggingface.co/collections/google/gemma-4-qat-q4-0… 博客:https://blog.google/innovation-and-ai/technology/developers-tools/quantization-aware-training-gemma-4/…
查看原文
查看缓存全文

缓存时间: 2026/06/08 15:22

权重:https://huggingface.co/collections/google/gemma-4-qat-q4-0… 博客:https://blog.google/innovation-and-ai/technology/developers-tools/quantization-aware-training-gemma-4/…


Gemma 4 QAT Q4_0 - 一个 Google 合集

来源:https://huggingface.co/collections/google/gemma-4-qat-q4-0

  • — #### google/gemma-4-E2B-it-qat-q4_0-unquantized 任意到任意 • 5B • 3天前更新 • 1.92k • 10 (https://huggingface.co/google/gemma-4-E2B-it-qat-q4_0-unquantized)
  • — #### google/gemma-4-E4B-it-qat-q4_0-unquantized 任意到任意 • 8B • 3天前更新 • 1.39k • 6 (https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-unquantized)
  • — #### google/gemma-4-12B-it-qat-q4_0-unquantized 任意到任意 • 12B • 3天前更新 • 4.52k • 32 (https://huggingface.co/google/gemma-4-12B-it-qat-q4_0-unquantized)
  • — #### google/gemma-4-26B-A4B-it-qat-q4_0-unquantized 图像-文本到文本 • 27B • 3天前更新 • 1.61k • 16 (https://huggingface.co/google/gemma-4-26B-A4B-it-qat-q4_0-unquantized)
  • — #### google/gemma-4-31B-it-qat-q4_0-unquantized 图像-文本到文本 • 33B • 3天前更新 • 1.81k • 13 (https://huggingface.co/google/gemma-4-31B-it-qat-q4_0-unquantized)
  • — #### google/gemma-4-E2B-it-qat-q4_0-unquantized-assistant 任意到任意 • 78M • 3天前更新 • 158 • 4 (https://huggingface.co/google/gemma-4-E2B-it-qat-q4_0-unquantized-assistant)
  • — #### google/gemma-4-E4B-it-qat-q4_0-unquantized-assistant 任意到任意 • 78.8M • 3天前更新 • 221 • 3 (https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-unquantized-assistant)
  • — #### google/gemma-4-12B-it-qat-q4_0-unquantized-assistant 任意到任意 • 0.4B • 3天前更新 • 1.12k • 13 (https://huggingface.co/google/gemma-4-12B-it-qat-q4_0-unquantized-assistant)
  • — #### google/gemma-4-26B-A4B-it-qat-q4_0-unquantized-assistant 图像-文本到文本 • 0.4B • 3天前更新 • 399 • 6 (https://huggingface.co/google/gemma-4-26B-A4B-it-qat-q4_0-unquantized-assistant)
  • — #### google/gemma-4-31B-it-qat-q4_0-unquantized-assistant 图像-文本到文本 • 0.5B • 3天前更新 • 1.13k • 12 (https://huggingface.co/google/gemma-4-31B-it-qat-q4_0-unquantized-assistant)
  • — #### google/gemma-4-E2B-it-qat-q4_0-gguf 任意到任意 • 5B • 3天前更新 • 9.57k • 26 (https://huggingface.co/google/gemma-4-E2B-it-qat-q4_0-gguf)
  • — #### google/gemma-4-E4B-it-qat-q4_0-gguf 任意到任意 • 7B • 2天前更新 • 12.8k • 27 (https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-gguf)
  • — #### google/gemma-4-12B-it-qat-q4_0-gguf 任意到任意 • 12B • 3天前更新 • 52.4k • 85 (https://huggingface.co/google/gemma-4-12B-it-qat-q4_0-gguf)
  • — #### google/gemma-4-26B-A4B-it-qat-q4_0-gguf 图像-文本到文本 • 25B • 3天前更新 • 18.6k • 42 (https://huggingface.co/google/gemma-4-26B-A4B-it-qat-q4_0-gguf)
  • — #### google/gemma-4-31B-it-qat-q4_0-gguf 图像-文本到文本 • 31B • 3天前更新 • 12.9k • 49 (https://huggingface.co/google/gemma-4-31B-it-qat-q4_0-gguf)
  • — #### google/gemma-4-E2B-it-qat-w4a16-ct 任意到任意 • 6B • 3天前更新 • 2.81k • 3 (https://huggingface.co/google/gemma-4-E2B-it-qat-w4a16-ct)
  • — #### google/gemma-4-E4B-it-qat-w4a16-ct 任意到任意 • 9B • 3天前更新 • 11.1k • 3 (https://huggingface.co/google/gemma-4-E4B-it-qat-w4a16-ct)
  • — #### google/gemma-4-12B-it-qat-w4a16-ct 任意到任意 • 13B • 3天前更新 • 152k • 16 (https://huggingface.co/google/gemma-4-12B-it-qat-w4a16-ct)
  • — #### google/gemma-4-31B-it-qat-w4a16-ct 图像-文本到文本 • 34B • 3天前更新 • 22.6k • 16 (https://huggingface.co/google/gemma-4-31B-it-qat-w4a16-ct)

相似文章

google/gemma-4-12B-it-qat-q4_0-gguf

Hugging Face Models Trending

Google DeepMind 发布了 Gemma 4 模型,这些模型通过量化感知训练(QAT)进行了优化,并提供包括 GGUF 在内的多种格式,在降低内存需求的同时实现了高质量。

google/gemma-4-26B-A4B-it

Hugging Face Models Trending

Google DeepMind 发布 Gemma 4,一系列开放权重的多模态模型,参数量从2.3B到31B,支持文本、图像、视频和音频输入。模型具有256K上下文窗口,MoE和密集架构,增强的推理能力,并针对从移动设备到服务器的部署进行优化。