black-box-transfer

标签

Cards List
#black-box-transfer

与大型语言模型无关的语义表示攻击

arXiv cs.CL · 2026-05-12 缓存

本文介绍了语义表示攻击(SRA),这是一种新颖的与大型语言模型无关的方法,它针对恶意语义表示而非确切文本进行优化,在多个开源模型中实现了高攻击成功率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈