FedOT:面向联邦潜在扩散模型的水印所有权验证和泄露溯源
摘要
FedOT提出了一种分块水印和潜在向量变换框架,用于联邦潜在扩散模型的所有权验证和泄露溯源,并防止水印移除攻击。
查看缓存全文
缓存时间: 2026/06/24 05:46
论文页面 - FedOT:面向联邦潜在扩散模型的版权验证与泄露溯源水印方案
来源:https://huggingface.co/papers/2606.22875
摘要
FedOT 是一个新颖的框架,通过引入分块水印和潜在向量变换,在联邦潜在扩散模型中实现版权验证与泄露溯源,从而有效防范水印移除攻击。
在联邦学习(FL)框架内训练潜在扩散模型(LDM)日益受到关注,因为它将 LDM 强大的生成能力与 FL 的隐私保护特性相结合。然而,FL 需要与多个参与者共享全局模型,这带来了恶意客户端未经授权分发或转售模型的风险。虽然一种直观的方法是采用现有的基于 VAE 的水印技术用于 FL 中的 LDM,但这种策略在应对此类威胁时存在不足,原因在于两个根本性挑战:(1)现有方法支持版权验证,但缺乏将模型泄露溯源到特定恶意客户端的能力;(2)基于 VAE 的水印脆弱易攻,只需用干净的解码器替换即可移除水印。在本文中,我们提出了 FedOT,这是首个在联邦 LDM 中实现版权验证与泄露溯源的框架。具体而言,针对第一个挑战,我们设计了一种分块水印,第一部分用于版权验证,第二部分用于客户端身份识别。此外,为克服第二个挑战并保护模型免受 VAE 替换攻击,我们引入了潜在向量变换(LVT),通过修改 VAE 的原始潜在分布,加强了 VAE 与 U-Net 潜在空间之间的连接。因此,任何试图替换 VAE 以移除水印的行为都将导致图像质量严重下降,从而使 LDM 模型无法使用。大量实验表明,FedOT 在版权验证和可溯源性方面均表现出卓越性能。项目页面:https://spyzixuan.github.io/FedOT/。
查看 arXiv 页面(https://arxiv.org/abs/2606.22875)查看 PDF(https://arxiv.org/pdf/2606.22875)项目页面(https://spyzixuan.github.io/FedOT)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.22875)
将本文档加入您的智能体:
hf papers read 2606.22875
没有最新 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用本文的模型 0
暂无模型关联本文
请在模型 README.md 中引用 arxiv.org/abs/2606.22875 以从本页面链接。
引用本文的数据集 0
暂无数据集关联本文
请在数据集 README.md 中引用 arxiv.org/abs/2606.22875 以从本页面链接。
引用本文的 Space 0
暂无 Space 关联本文
请在 Space README.md 中引用 arxiv.org/abs/2606.22875 以从本页面链接。
包含本文的收藏集 0
暂无收藏集包含本文
请将本文添加到收藏集(https://huggingface.co/new-collection)以从本页面链接。
相似文章
针对封闭 LLM 的可证明检测的数据集水印
本文提出了一种针对封闭大型语言模型(LLM)的新型数据集水印方法。该方法利用词对共现模式,能够以可证明的方式检测模型训练是否使用了专有数据,即使这些数据在训练数据集中仅占极小比例。
线性集成消除水印:论LLM中分布扰动的脆弱性
本文揭示了LLM水印的一个基本漏洞:当用户能够访问多个模型时,对其输出分布进行平均会抵消水印扰动,从而规避检测。作者提出了WASH方法,并通过实验证明,对3-5个模型进行平均可将检测z分数抑制在阈值以下,同时提升文本质量。
Chainwash:扩散语言模型水印的多步重写攻击
本研究论文介绍了Chainwash,一种多步重写攻击,能够有效删除扩散语言模型(LLaDA-8B-Instruct)输出中的统计水印,经过五次链式重写后,检测率从87.9%降至4.86%。
语言感知的非失真性LLM水印
介绍了LUNA,一种语言感知的LLM水印方法,实现了跨多语言的非失真嵌入和无模型检测,显著提升了AUROC和困惑度保持。
共享潜在结构实现LLMs中后门攻击的统一检测与缓解
本文识别了LLMs中不同后门行为之间的共享潜在机制,利用稀疏自编码器检测并因果抑制这些特征,从而在多种模型和攻击类型中实现统一的后门检测与缓解。