mixtral

标签

Cards List
#mixtral

Mixtral MoE在良性及有害提示下的安全导向路由分析

arXiv cs.AI · 2026-05-26 缓存

本文利用基于激活和梯度的信号,分析了Mixtral 8x7B-Instruct在良性及有害提示下的路由行为。研究发现,与安全相关的路由行为是微妙的、依赖层深度的,并且是分布式的,而非由固定的一组专家主导。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈