model-pruning

标签

Cards List
#model-pruning

@dealignai: MiniMax m3,专为 128GB Mac 打造。感谢 @hornsby_andrew 准备剪枝校准数据集并进行…

X AI KOLs Timeline · 2026-06-18 缓存

经过剪枝和量化的 MiniMax-M3 版本(MiniMax-M3-Medium-JANG_2L),针对使用 vMLX 在 128GB Mac 上运行进行了优化,采用 32% 专家剪枝和 JANG_2L 混合精度量化,使其占用空间约 105 GB。

0 人收藏 0 人点赞
#model-pruning

超越余弦相似度:重新思考大语言模型中的层相关性

arXiv cs.LG · 2026-05-15 缓存

本文证明,余弦相似度作为评估大语言模型中层重要性的指标效果不佳,并提出使用层移除后实际准确率下降作为更稳健的度量标准。

0 人收藏 0 人点赞
#model-pruning

修剪不安全票:一种资源高效的框架,用于更安全、更鲁棒的大型语言模型

arXiv cs.CL · 2026-04-20 缓存

本文介绍了一种资源高效的修剪框架,该框架能够识别并移除大型语言模型中与不安全行为相关的参数,同时保持模型的实用性。该方法利用无梯度归因和彩票假说视角,在最小化性能损失的前提下,显著减少了不安全内容的生成,并增强了对越狱攻击的鲁棒性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈