model-extraction

#model-extraction

ADS-C：面向分类的反蒸馏采样方法

arXiv cs.LG ↗ · 2026-07-20 缓存

本文提出ADS-C，一种面向分类任务的反蒸馏防御方法。它可在证明保留top-1精度的同时，将学生模型性能降低高达29.7个百分点，且对教师模型实现零效用成本。

0 人收藏 0 人点赞

#model-extraction

arXiv cs.AI ↗ · 2026-06-02 缓存

本文介绍了推理暴露提示（REP）方法，该方法利用代码格式的阴影模型演示，从大语言模型中引出隐藏的推理痕迹，表明接口级别的痕迹隐藏不足以阻止提取有用的推理信号。

0 人收藏 0 人点赞

#model-extraction

arXiv cs.LG ↗ · 2026-06-01 缓存

本文首次提出在严格黑盒约束下对图分类的模型提取攻击，利用子图解释来估计决策边界。研究结果表明，强制性的可解释性接口在**图神经网络**服务中造成了可被利用的安全漏洞。

0 人收藏 0 人点赞

#model-extraction

Reddit r/LocalLLaMA ↗ · 2026-04-21

有用户发现，从 Android 版 Google AI Edge Gallery 提取的 3.6 GB Gemma 4 e4b 模型，比 3.7 GB 的 Unsloth 版本和社区移植版表现更好，引发对谷歌是否暗藏优化的猜测。

0 人收藏 0 人点赞