lottery-ticket-hypothesis

#lottery-ticket-hypothesis

超参数化的谜之成功：彩票假说还是逃逸维度？

Hacker News Top ↗ · 2天前

一篇研究神经网络超参数化成功原因的论文，比较了彩票假说与逃逸维度。

0 人收藏 0 人点赞

#lottery-ticket-hypothesis

arXiv cs.CL ↗ · 2026-04-20 缓存

本文介绍了一种资源高效的修剪框架，该框架能够识别并移除大型语言模型中与不安全行为相关的参数，同时保持模型的实用性。该方法利用无梯度归因和彩票假说视角，在最小化性能损失的前提下，显著减少了不安全内容的生成，并增强了对越狱攻击的鲁棒性。

0 人收藏 0 人点赞