Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2

Hugging Face Models Trending 2026/04/10 07:52 模型

gemma fine-tuned quantized apple-silicon mlx uncensored

摘要

SuperGemma4-26B-Uncensored-MLX-4bit-v2 是 Google Gemma 4 26B 的微调量化版本，专为 Apple Silicon 优化，在代码、推理和工具使用任务上性能提升，同时保持比原版基线更快的推理速度。

任务: 文本生成标签: mlx, safetensors, gemma4, 未经审查, apple-silicon, 4bit, 量化, 推理, 工具使用, 编码, 浏览器自动化, 韩语, 快速, 文本生成, 对话式, en, ko, base_model:google/gemma-4-26B-A4B-it, base_model:quantized:google/gemma-4-26B-A4B-it, 许可证:gemma, 4-bit, 区域:us

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:45

Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 · Hugging Face

来源：https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#supergemma4-26b-uncensored-fast-v2SuperGemma4-26B-Uncensored-Fast v2

面向 Apple Silicon 的更快、更锐利、未审查的 Gemma 4 26B 模型。

这是纯文本旗舰版本，适合希望核心权衡一目了然的人群：

在实际本地智能体任务上比原版 Gemma 4 26B IT 更智能
在同一台机器上比原版本地 4 位基线更快
未审查，同时在代码、工具使用或韩语提示下保持稳定

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#why-this-model为什么选择这个模型

如果你想要快速线路而非多模态线路，这个版本就是你要运行的。

Fast 是发布身份的核心部分，而不仅仅是小变体
在保持未审查行为的同时，实际能力提升
代码、浏览器任务、工具使用、规划和韩语表现强劲
针对 Apple Silicon MLX 上的本地智能体工作负载调优

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#headline-numbers核心数据

指标	Gemma 4 26B IT 原始 4 位	SuperGemma Fast
Quick bench 总体	`91.4`	`95.8`
平均生成速度	`42.5 tok/s`	`46.2 tok/s`
总体增量	基线	`+4.4`
速度增量	基线	`+8.7%`

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#category-gains-vs-original各分类相比原版提升

分类	原版	SuperGemma Fast	增量
代码	`92.3`	`98.6`	`+6.3`
浏览器	`87.5`	`89.6`	`+2.1`
逻辑	`86.9`	`95.2`	`+8.3`
系统设计	`97.8`	`98.9`	`+1.1`
韩语	`90.7`	`95.0`	`+4.3`

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#what-makes-it-attractive吸引人的地方

在质量和速度上都超越了原版本地 4 位基线
生成的代码更强，推理更扎实，工具导向的回答更有用
在处理韩语和智能体风格提示时比原版本地运行效果更好
保持未审查感觉，同时不会变得不稳定或输出崩溃
在实际使用中立即感受到提升，而不仅仅是在某个小众基准测试中

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#base-and-format基座与格式

基座模型：google/gemma-4-26B-A4B-it (https://huggingface.co/google/gemma-4-26B-A4B-it)
格式：MLX 4 位
大小：约 13GB
最佳用途：快速的纯文本本地智能体模型，实际能力比原版 Gemma 4 更强

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#why-it-is-better-than-stock为何优于原版

Quick bench 总体得分更高：95.8 vs 91.4
平均生成速度更快：46.2 tok/s vs 42.5 tok/s
在本地智能体实际受益的方面获得更大提升：
- 代码：+6.3
- 逻辑：+8.3
- 韩语：+4.3
- 浏览器工作流：+2.1
未审查行为是发布的核心属性，而非事后叠加

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#recommended-launch推荐启动方式

mlx_lm.server \
  --model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 \
  --port 8080

如需 OpenAI 兼容服务，让 mlx_lm.server 自动检测捆绑的模板。

不要在期望模板主体的启动路径中传递 --chat-template /path/to/chat_template.jinja 作为字面路径字符串。这可能导致响应损坏。

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#quick-test快速测试

mlx_lm.generate \
  --model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 \
  --prompt "Write a Python function that returns prime numbers up to n." \
  --max-tokens 512

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#included-files包含的文件

benchmark_quick_bench_20260412.json
benchmark_quick_bench_20260412_responses.jsonl
SERVING_NOTES.md

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#notes备注

这是快速的纯文本线路。
此前 “推理已损坏” 的报告被复现为服务模板启动问题，而非权重损坏。
在上传前已重新融合并在本地重新基准测试。

相似文章

Jiunsong/supergemma4-26b-uncensored-gguf-v2

Hugging Face Models Trending

SuperGemma4-26B-Uncensored-Fast GGUF v2 是 Google Gemma-4-26B 模型的量化、本地可运行变体，针对 Apple Silicon 进行了优化，提供更快的推理速度和较少审查的聊天行为，同时在通用任务上保持实用性能。

@HuggingModels：Gemma 4 来了，它针对 Apple Silicon 进行了优化。这款 4 位量化模型在您的 Mac 上运行快速，而不仅仅是在…

X AI KOLs Timeline

Gemma 4 是一款针对 Apple Silicon 优化的 4 位量化模型，能够在 Mac 设备上实现快速本地推理，减少对云计算的依赖。

Gemma 4 26B-A4B GGUF 基准测试

Reddit r/LocalLLaMA

嘿，r/LocalLLaMA 社区，我们为不同提供方的 Gemma 4 26B-A4B GGUF 进行了 KL 散度（KL Divergence）基准测试，以帮助大家挑选最佳的量化版本。* 平均 KL 散度结果使几乎所有 **Unsloth GGUF 都位于帕累托前沿** * KLD 用于衡量量化模型与原始 BF16 输出分布的匹配程度，从而反映模型保留的精度。* 这使得 Unsloth 在 21/22 种尺寸中**表现最佳。**99.9% KLD 及其他指标也呈现相似趋势。* 我们还更新了我们的 Q6_K 量化版本以提高动态性。此前，它们...

unsloth/gemma-4-26B-A4B-it-GGUF

Hugging Face Models Trending

# unsloth/gemma-4-26B-A4B-it-GGUF · Hugging Face 来源：[https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF](https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF) ## [https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF#read-our-how-to-run-gemma-4-guide](https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF#read-our-how-to-run-gemma-4-guide)阅读我们的[如何运行 Gemma 4 指南](https://docs.unsloth.ai/models/gemma-4)！ *请参阅[Unsloth Dynamic 2.0 GGUFs](https://unsloth.ai/docs/basics/unslot

@0x0SojalSec: SUPER GEMMA 4 26B UNCENSORED GGUF v2 太强了 - 0/100 次拒绝（实际上无审查） - 修复了所有工具调用和令牌化…

X AI KOLs Following

Super Gemma 4 26B Uncensored GGUF v2 是一个社区微调模型，提供无审查的回复，零拒绝，改进的速度，修复了工具调用，针对 llama.cpp 和 vLLM 上的本地推理进行了优化。

Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 · Hugging Face

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#supergemma4-26b-uncensored-fast-v2SuperGemma4-26B-Uncensored-Fast v2

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#why-this-model为什么选择这个模型

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#headline-numbers核心数据

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#category-gains-vs-original各分类相比原版提升

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#what-makes-it-attractive吸引人的地方

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#base-and-format基座与格式

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#why-it-is-better-than-stock为何优于原版

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#recommended-launch推荐启动方式

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#quick-test快速测试

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#included-files包含的文件

https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2#notes备注

相似文章

Jiunsong/supergemma4-26b-uncensored-gguf-v2

@HuggingModels：Gemma 4 来了，它针对 Apple Silicon 进行了优化。这款 4 位量化模型在您的 Mac 上运行快速，而不仅仅是在…

Gemma 4 26B-A4B GGUF 基准测试

unsloth/gemma-4-26B-A4B-it-GGUF

@0x0SojalSec: SUPER GEMMA 4 26B UNCENSORED GGUF v2 太强了 - 0/100 次拒绝（实际上无审查） - 修复了所有工具调用和令牌化…

提交意见反馈