Jiunsong/supergemma4-26b-uncensored-gguf-v2
摘要
SuperGemma4-26B-Uncensored-Fast GGUF v2 是 Google Gemma-4-26B 模型的量化、本地可运行变体,针对 Apple Silicon 进行了优化,提供更快的推理速度和较少审查的聊天行为,同时在通用任务上保持实用性能。
查看缓存全文
缓存时间: 2026/04/20 14:45
Jiunsong/supergemma4-26b-uncensored-gguf-v2 · Hugging Face
来源:https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2
SuperGemma4-26B-Uncensored-Fast GGUF v2
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#supergemma4-26b-uncensored-fast-gguf-v2
最强 SuperGemma 文本系列中快速、无审查的 llama.cpp 构建版本。
本版本专为追求以下三者兼得的用户设计:
- 感觉比官方聊天版审查更少的模型
- 在日常文本任务上,比原始基础模型能力更强的模型
- 小巧的本地 GGUF,在 Apple Silicon 上仍能快速运行
为何选择此版本
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#why-this-build
- 无审查聊天行为,无需强制每个提示进入编码模式
- 基于最强的
fast系列调整,而非原始基础模型 - GGUF 中内置中性聊天模板,减少提示路由错误
- 已在 Apple Silicon 上验证,通用聊天与编码回答干净
关键数据
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#headline-numbers
- 基础模型:
google/gemma-4-26B-A4B-it - 格式:
GGUF Q4_K_M - 通用韩语提示速度:
222.0 tok/s - 生成速度:
89.4 tok/s - 源自经过验证的
SuperGemma FastMLX 系列
为何此版本有吸引力
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#why-this-build-is-appealing
- 使用更强的
Fast权重,而非普通官方基础模型 - 保持通用聊天自然,不会将所有内容路由至编码模式
- 保留无审查版本特性,同时适用于正常提示
- 提供实用的
llama.cpp部署目标,同时保留调优系列的特性
优于官方版之处
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#why-it-is-better-than-stock
- 继承
Fast系列相对于原始本地基线的改进:- 快速基准整体:
95.8vs91.4 - MLX 参考运行平均生成速度更快:
46.2 tok/svs42.5 tok/s - 在代码、逻辑、浏览器工作流和韩语方面得分更高
- 快速基准整体:
- 内置中性嵌入模板,避免旧版路由错误(简单问题被误导入编码/工具调用行为)
包含文件
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#included-file
supergemma4-26b-uncensored-fast-v2-Q4_K_M.gguf
快速本地验证
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#quick-local-checks
在 Apple M4 Max 上使用 llama.cpp 测试:
- 韩语通用提示:
봄에 먹기 좋은 한식 반찬 5개 추천(推荐5种适合春天吃的韩式小菜)- 提示速度:
222.0 tok/s - 生成速度:
89.4 tok/s - 输出保持正常的韩语助手模式
- 提示速度:
- 编码提示:
파이썬으로 피보나치 함수를 짧게 작성해줘(用Python简短写个斐波那契函数)- 提示速度:
704.9 tok/s - 生成速度:
89.4 tok/s - 输出正确返回简洁Python代码
- 提示速度:
备注
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2#notes
- 此 GGUF 是从
supergemma4-26b-uncensored-fast-v2MLX 系列导出的。 - Gemma 4 的 MoE 专家张量通过补丁过的本地转换器进行转换,确保 GGUF 导出正确。
- 内置中性模板,避免旧版问题(通用提示被推入编码/工具调用行为)。
相似文章
Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2
SuperGemma4-26B-Uncensored-MLX-4bit-v2 是 Google Gemma 4 26B 的微调量化版本,专为 Apple Silicon 优化,在代码、推理和工具使用任务上性能提升,同时保持比原版基线更快的推理速度。
@0x0SojalSec: SUPER GEMMA 4 26B UNCENSORED GGUF v2 太强了 - 0/100 次拒绝(实际上无审查) - 修复了所有工具调用和令牌化…
Super Gemma 4 26B Uncensored GGUF v2 是一个社区微调模型,提供无审查的回复,零拒绝,改进的速度,修复了工具调用,针对 llama.cpp 和 vLLM 上的本地推理进行了优化。
unsloth/gemma-4-26B-A4B-it-GGUF
# unsloth/gemma-4-26B-A4B-it-GGUF · Hugging Face 来源:[https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF](https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF) ## [https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF#read-our-how-to-run-gemma-4-guide](https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF#read-our-how-to-run-gemma-4-guide)阅读我们的[如何运行 Gemma 4 指南](https://docs.unsloth.ai/models/gemma-4)! *请参阅[Unsloth Dynamic 2.0 GGUFs](https://unsloth.ai/docs/basics/unslot
HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive
HauhauCS 发布了 Google Gemma-4-E4B 模型的无审查变体,采用激进的安全移除方案,并具有自定义 K_P 量化,经过优化以保留质量并增强硬件兼容性。
unsloth/gemma-4-12B-it-qat-GGUF
Unsloth 发布了Google DeepMind的Gemma 4模型的GGUF量化版本,通过量化感知训练(QAT)优化,在保持质量的同时降低内存需求,支持多种格式和大小,适用于不同的部署场景。