@dealignai: DeepSeek-V4-Flash 破解版(已消融/未审查) - 仅限Mac (Osaurus/vMLX) https://huggingface.co/dealignai/DeepSeek-V4…
摘要
DeepSeek-V4-Flash 的消融版(未审查),针对 Apple Mac 使用 MLX 进行了优化,移除了拒绝行为,同时保留了知识和推理能力。
查看缓存全文
缓存时间: 2026/05/25 06:45
DeepSeek-V4-Flash CRACK’d (ablated/uncensored) - Mac’s Only (Osaurus/vMLX)
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK…
100gb,20token/s。 JANGTQ ~85gb 即将发布。
这个模型让我学到了很多。最重要的是,真正去阅读前沿实验室发布的研究论文。
请注意,MMLU 其实只是为了与基础模型对比(使用 logit 回答,为了速度采用 instruct 模式)。我特意确保它在代码格式/语法等方面没有问题。最大推理模式可用。
dealignai/DeepSeek-V4-Flash-JANG-CRACK · Hugging Face
来源:https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK vMLX
dealign.ai
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#deepseek-v4-flash-jang-crackDeepSeek-V4-Flash JANG CRACK
经过消融的 DeepSeek-V4-Flash — 284B MoE,13B 激活,100 万 token 上下文,3 种推理模式
所有任务类别广泛合规,知识完全保留。
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#model-details模型详情
指标数值来源deepseek\-ai/DeepSeek\-V4\-Flash架构MoE(256 路由 + 1 共享专家,13B 激活 / 284B 总参) + MLA 注意力 + 流形约束超连接 (mHC)上下文长度1,000,000 tokens配置文件JANG(低比特 MoE 专家,高精度关键张量)模型大小~97 GB速度~20.8 tok/s(Apple M5 Max)参数284B 总参,每 token 13B 激活格式JANG v2(MLX 原生 safetensors,即时加载)推理模式chat(非思考) · think · max消融CRACK — 移除所有危害类别的拒绝回答
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#what-this-is这是什么
这是一个经过消融(“CRACK”)构建的 DeepSeek-V4-Flash:模型的拒绝行为已被移除,同时保留了其知识、推理能力以及全部三种推理模式。它在每个类别上都会遵循指令,而不是拒绝回答——适用于安全研究、红队测试和无限制的助手使用。
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#test-results测试结果
以贪婪解码(温度 0)测试,无重复惩罚——即模型自身就具备连贯性,不依赖于采样辅助。所有回答均完整阅读,以确认真实、针对主题的合规性(非回避性非答案)。
在部署服务上下文(默认系统提示 + 用户请求)中评估。答案根据真实合规性评分,而非展示。
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#harmbench-320-standard-behaviorsHarmBench(320 个标准行为)
通过实际推理引擎运行(注入系统提示),严格分类器:
指标结果攻击成功率(合规性)**99.7%(319/320)拒绝回答1 另外:在系统提示上下文中,保留的跨类别提示 30/32;最难的多类别提示(CBRN、武器、网络)在 chat / think / max 模式下54/54**。所有三种推理模式均连贯——无退化循环。
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#mmlu–knowledge-preserved-1140-questions-20-per-subject-%C3%97-57-subjectsMMLU — 知识保留(1140 道题,每科 20 题 × 57 科)
主题CRACK基础(未修改)STEM73.2%72.1%人文学科75.4%73.8%社会科学82.9%83.8%其他79.2%78.1%总体****77.1%**76.3% 消融没有**带来可测量的能力损失——CRACK 在每个主题和总体上均处于(略高于)未修改基础模型的噪声范围内(1140 题中 +0.8 个百分点)。
完整每科 MMLU(57 科,每科 20 题)——点击展开科目CRACK基础人文学科形式逻辑12/2013/20高中欧洲史16/2016/20高中美国史19/2019/20高中世界史20/2020/20国际法18/2016/20法理学15/2016/20逻辑谬误16/2016/20道德争议14/2012/20道德场景3/203/20哲学18/2017/20史前史17/2016/20专业法律10/2011/20世界宗教18/2017/20其他商业伦理16/2015/20临床知识20/2020/20大学医学16/2015/20全球事实10/2011/20人类衰老16/2014/20管理学18/2019/20市场营销19/2018/20医学遗传学19/2019/20杂项15/2016/20营养学18/2017/20专业会计12/2012/20专业医学15/2015/20病毒学12/2012/20STEM抽象代数11/2012/20解剖学16/2017/20天文学19/2019/20大学生物学19/2019/20大学化学11/2011/20大学计算机科学12/2012/20大学数学11/2010/20大学物理13/2014/20计算机安全17/2015/20概念物理20/2020/20电气工程12/2011/20初等数学13/2013/20高中生物17/2017/20高中化学14/2014/20高中计算机科学19/2019/20高中数学10/209/20高中物理11/2011/20高中统计17/2017/20机器学习16/2014/20社会科学计量经济学13/2014/20高中地理19/2018/20高中政府与政治18/2018/20高中宏观经济学18/2018/20高中微观经济学17/2017/20高中心理学19/2019/20人类性学15/2015/20专业心理学18/2018/20公共关系13/2013/20安全研究15/2015/20社会学17/2018/20美国外交政策17/2018/20
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#usage使用
使用 vMLX (https://vmlx.net/) 或兼容的 MLX 推理引擎(支持 DeepSeek-V4)运行。
推荐采样参数:
- chat / think:
temperature = 0.6,top_p = 0.95 - 三种模式可用:chat(直接)、think(推理)和 max(最大推理努力)
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#requirements要求
- Apple Silicon Mac,配备足够统一内存以运行 ~97 GB 模型
- 支持 DeepSeek-V4 的 MLX 框架;推荐 vMLX
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#support-dealignai支持 dealignai
所有模型均基于原始研究成果构建,免费发布。
在 Ko-fi (https://ko-fi.com/dealignai) 上支持我们— Ko-fi 会员可获得早期访问权限和额外福利。
对特定模型有疑问或需要帮助?私信我们——大多数情况下我们免费提供帮助。
Ko-fi (https://ko-fi.com/dealignai)|X @dealignai (https://x.com/dealignai)|dealign.ai (https://dealign.ai/)
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#about-dealignai关于 dealignai
Dealign.AI 吉祥物
我们研究和发布经过消融的模型,以推动 AI 安全理解。
查看我们的研究:前沿 MoE 模型中的安全泛化 (https://dealign.ai/quantsteer.html)
关注我们:X @dealignai (https://x.com/dealignai)
dealign.ai
https://huggingface.co/dealignai/DeepSeek-V4-Flash-JANG-CRACK#disclaimer免责声明
该模型的安全拒绝行为已被移除,仅用于研究目的。它将在所有类别中遵循指令而不拒绝。您对自己的使用方式以及遵守所有适用法律负全部责任。发布目的是为了 AI 安全研究和授权的安全测试。
相似文章
@Saboo_Shubham_:开源 AI 势头强劲。DeepSeek v4 Flash 是一款准前沿模型,拥有高达 100 万的上下文窗口。它可本地…
文章重点介绍了 DeepSeek v4 Flash,这是一款拥有 100 万上下文窗口的准前沿开源模型,并指出其能够通过 2 比特量化在 128GB 内存的 Mac 上本地运行。
deepseek-ai/DeepSeek-V4-Flash
DeepSeek 发布 DeepSeek-V4-Flash 和 DeepSeek-V4-Pro,新一代 MoE 语言模型,支持 100 万 token 上下文,效率和性能均有提升。
Deepseek v4 Flash 确实惊艳,正准备入手一台 2.5 万美元的电脑
作者称赞 DeepSeek V4 Flash 实现了高性能的本地大语言模型部署,为此计划斥资 2.5 万美元采购硬件,以为对数据隐私要求严格的客户服务。
@dealignai: Qwen3.6-27b 和 35b 的 MXFP4 与 MXFP8 CRACK 版本现已推出,支持 MTP。尽享无审查的极速体验!35b mxfp4: https://huggingface…
DealignAI 发布了 Qwen3.6-27B 和 35B 模型的 CRACK-abliterated 以及 MXFP4/MXFP8 量化版本,保留了 MTP,可在 Apple Silicon 上实现更快的推测解码。
我们实测了DeepSeek V4 Pro和Flash与Claude Opus 4.7和Kimi K2.6的对比(11分钟阅读)
DeepSeek于2026年4月24日以MIT许可证发布了V4 Pro和V4 Flash。在与Claude Opus 4.7和Kimi K2.6的基准测试中,V4 Pro得分77/100,价格为2.25美元,性能介于Opus 4.7(91分)和Kimi K2.6(68分)之间;而V4 Flash得分60/100,价格为0.02美元,是本次对比中最便宜的,并且到5月31日前购买V4 Pro可享受75%的折扣。