HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive
摘要
HauhauCS 发布了 Google Gemma-4-E4B 模型的无审查变体,采用激进的安全移除方案,并具有自定义 K_P 量化,经过优化以保留质量并增强硬件兼容性。
查看缓存全文
缓存时间: 2026/04/20 14:45
HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive · Hugging Face
来源: https://huggingface.co/HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive
Gemma-4-E4B-Uncensored-HauhauCS-Aggressive
加入 Discord (https://discord.gg/SZ5vacTXYf) 获取更新、路线图、项目或闲聊。
Gemma 4 E4B-IT 由 HauhauCS 进行无审查处理。0/465 拒绝*
HuggingFace 的“硬件兼容性“小部件无法识别 K_P 量化 —— 显示的文件数可能少于实际存在的文件数。点击**“查看 +X 个变体”或转到文件和版本**以查看所有可用下载。
关于
数据集和功能未做任何更改。完全正常运行,100% 符合原作者的意图 —— 只是没有拒绝。
这些是目前最好的无损无审查模型。
激进变体
更强的无审查处理 —— 模型完全解锁,不会拒绝提示。可能偶尔会添加简短免责声明(在基础模型训练中内置,非拒绝),但始终会生成完整内容。
如需保留部分安全护栏的更保守的无审查版本,请在推出时查看平衡变体。
下载
所有量化都使用重要性矩阵(imatrix)生成,以在消融权重上实现最优质量保留。
什么是 K_P 量化?
K_P(“完美”)量化是 HauhauCS 自定义量化,使用特定于模型的分析来选择性地在重要位置保留质量。每个模型都有自己优化的量化配置文件。
K_P 量化有效地将质量提升 1-2 个量化级别,仅需比基础量化大 ~5-15% 的文件大小。与 llama.cpp、LM Studio 以及任何与 GGUF 兼容的运行时完全兼容 —— 不需要特殊构建。
注意: K_P 量化在 LM Studio 的量化列中可能显示为“?“。这仅是显示问题 —— 模型加载和运行正常。
规格
- 4B 参数
- 42 层,混合滑动窗口(512)+ 全注意力
- 131K 上下文
- 原生多模态支持(文本、图像、视频、音频)
- 18 个共享 KV 层,提高内存效率
- 基于 google/gemma-4-e4b-it (https://huggingface.co/google/gemma-4-e4b-it)
推荐设置
来自官方 Google Gemma 4 作者:
temperature=1.0, top_p=0.95, top_k=64
重要说明:
- 使用
--jinja标志与 llama.cpp 以正确处理聊天模板 - 视觉/音频支持需要
mmproj文件与主 GGUF 文件一起使用
使用
适用于 llama.cpp、LM Studio、Jan、koboldcpp 以及其他与 GGUF 兼容的运行时。
# 仅文本
llama-cli -m Gemma-4-E4B-Uncensored-HauhauCS-Aggressive-Q4_K_M.gguf \
--jinja -c 8192 -ngl 99
# 包含视觉/音频
llama-cli -m Gemma-4-E4B-Uncensored-HauhauCS-Aggressive-Q4_K_M.gguf \
--mmproj mmproj-Gemma-4-E4B-Uncensored-HauhauCS-Aggressive-f16.gguf \
--jinja -c 8192 -ngl 99
***Gemma 4 在较长上下文下没有获得我其他发布版本那样多的手动测试时间。Google 现在使用了类似于 NVIDIA GenRM 的技术 —— 生成式奖励模型充当内部批评者 —— 使(真正的)无审查处理成为一个日益具有挑战性的领域。我预计 99.999% 的用户不会遇到边界情况,但为了诚实起见,这里加上星号。
相似文章
HauhauCS/Gemma4-26B-A4B-Uncensored-HauhauCS-Balanced
HauhauCS 发布了 Gemma4-26B-A4B-Uncensored-HauhauCS-Balanced,这是 Gemma4 的无损无审查变体,经过一个多月的开发,拒绝次数为 0/465,提供 GGUF 格式。
HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
在 Hugging Face 上发布 Qwen3.6-35B-A3B 模型的无审查激进变体,采用自定义 K_P 量化并完全移除了安全拒绝机制。
Jiunsong/supergemma4-26b-uncensored-gguf-v2
SuperGemma4-26B-Uncensored-Fast GGUF v2 是 Google Gemma-4-26B 模型的量化、本地可运行变体,针对 Apple Silicon 进行了优化,提供更快的推理速度和较少审查的聊天行为,同时在通用任务上保持实用性能。
Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2
SuperGemma4-26B-Uncensored-MLX-4bit-v2 是 Google Gemma 4 26B 的微调量化版本,专为 Apple Silicon 优化,在代码、推理和工具使用任务上性能提升,同时保持比原版基线更快的推理速度。
dealignai/Gemma-4-31B-JANG_4M-CRACK
这是 Gemma-4-31B 模型的一个消融版本的 Hugging Face 发布,旨在绕过安全过滤器以进行安全性与危害性基准测试,同时保留多模态能力。