Jiunsong/supergemma4-26b-uncensored-gguf-v2

Hugging Face Models Trending 模型

摘要

SuperGemma4-26B-Uncensored-Fast GGUF v2 是 Google Gemma-4-26B 模型的量化、本地可运行变体,针对 Apple Silicon 进行了优化,提供更快的推理速度和较少审查的聊天行为,同时在通用任务上保持实用性能。

任务: 文本生成, 标签: gguf, gemma4, 未经审查, 快速, llama.cpp, apple-silicon, 对话, 韩语, 编码, 工具使用, 文本生成, 英语, 韩语, base_model:google/gemma-4-26B-A4B-it, base_model:quantized:google/gemma-4-26B-A4B-it, license:gemma, 端点兼容, region:us
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:45

Jiunsong/supergemma4-26b-uncensored-gguf-v2 · Hugging Face

来源:https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2

SuperGemma4-26B-Uncensored-Fast GGUF v2

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#supergemma4-26b-uncensored-fast-gguf-v2

最强 SuperGemma 文本系列中快速、无审查的 llama.cpp 构建版本。

本版本专为追求以下三者兼得的用户设计:

  • 感觉比官方聊天版审查更少的模型
  • 在日常文本任务上,比原始基础模型能力更强的模型
  • 小巧的本地 GGUF,在 Apple Silicon 上仍能快速运行

为何选择此版本

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#why-this-build

  • 无审查聊天行为,无需强制每个提示进入编码模式
  • 基于最强的 fast 系列调整,而非原始基础模型
  • GGUF 中内置中性聊天模板,减少提示路由错误
  • 已在 Apple Silicon 上验证,通用聊天与编码回答干净

关键数据

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#headline-numbers

  • 基础模型:google/gemma-4-26B-A4B-it
  • 格式:GGUF Q4_K_M
  • 通用韩语提示速度:222.0 tok/s
  • 生成速度:89.4 tok/s
  • 源自经过验证的 SuperGemma Fast MLX 系列

为何此版本有吸引力

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#why-this-build-is-appealing

  • 使用更强的 Fast 权重,而非普通官方基础模型
  • 保持通用聊天自然,不会将所有内容路由至编码模式
  • 保留无审查版本特性,同时适用于正常提示
  • 提供实用的 llama.cpp 部署目标,同时保留调优系列的特性

优于官方版之处

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#why-it-is-better-than-stock

  • 继承 Fast 系列相对于原始本地基线的改进:
    • 快速基准整体:95.8 vs 91.4
    • MLX 参考运行平均生成速度更快:46.2 tok/s vs 42.5 tok/s
    • 在代码、逻辑、浏览器工作流和韩语方面得分更高
  • 内置中性嵌入模板,避免旧版路由错误(简单问题被误导入编码/工具调用行为)

包含文件

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#included-file

  • supergemma4-26b-uncensored-fast-v2-Q4_K_M.gguf

快速本地验证

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#quick-local-checks

在 Apple M4 Max 上使用 llama.cpp 测试:

  • 韩语通用提示:봄에 먹기 좋은 한식 반찬 5개 추천(推荐5种适合春天吃的韩式小菜)
    • 提示速度:222.0 tok/s
    • 生成速度:89.4 tok/s
    • 输出保持正常的韩语助手模式
  • 编码提示:파이썬으로 피보나치 함수를 짧게 작성해줘(用Python简短写个斐波那契函数)
    • 提示速度:704.9 tok/s
    • 生成速度:89.4 tok/s
    • 输出正确返回简洁Python代码

备注

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#notes

  • 此 GGUF 是从 supergemma4-26b-uncensored-fast-v2 MLX 系列导出的。
  • Gemma 4 的 MoE 专家张量通过补丁过的本地转换器进行转换,确保 GGUF 导出正确。
  • 内置中性模板,避免旧版问题(通用提示被推入编码/工具调用行为)。

相似文章

Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2

Hugging Face Models Trending

SuperGemma4-26B-Uncensored-MLX-4bit-v2 是 Google Gemma 4 26B 的微调量化版本,专为 Apple Silicon 优化,在代码、推理和工具使用任务上性能提升,同时保持比原版基线更快的推理速度。

unsloth/gemma-4-26B-A4B-it-GGUF

Hugging Face Models Trending

# unsloth/gemma-4-26B-A4B-it-GGUF · Hugging Face 来源:[https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF](https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF) ## [https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF#read-our-how-to-run-gemma-4-guide](https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF#read-our-how-to-run-gemma-4-guide)阅读我们的[如何运行 Gemma 4 指南](https://docs.unsloth.ai/models/gemma-4)! *请参阅[Unsloth Dynamic 2.0 GGUFs](https://unsloth.ai/docs/basics/unslot

HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive

Hugging Face Models Trending

HauhauCS 发布了 Google Gemma-4-E4B 模型的无审查变体,采用激进的安全移除方案,并具有自定义 K_P 量化,经过优化以保留质量并增强硬件兼容性。

unsloth/gemma-4-12B-it-qat-GGUF

Hugging Face Models Trending

Unsloth 发布了Google DeepMind的Gemma 4模型的GGUF量化版本,通过量化感知训练(QAT)优化,在保持质量的同时降低内存需求,支持多种格式和大小,适用于不同的部署场景。