FedOT:面向联邦潜在扩散模型的水印所有权验证和泄露溯源

Hugging Face Daily Papers 论文

摘要

FedOT提出了一种分块水印和潜在向量变换框架,用于联邦潜在扩散模型的所有权验证和泄露溯源,并防止水印移除攻击。

在联邦学习(FL)中训练潜在扩散模型(LDM)因其结合了LDM的强大生成能力和FL的隐私保护特性而受到越来越多的关注。但是,FL需要与多个参与者共享全局模型,这存在恶意客户端未经授权分发或转售模型的风险。虽然直观的方法是采用现有的基于VAE的水印技术用于FL中的LDM,但该策略在应对此类威胁时存在两个基本挑战:(1)现有方法支持所有权验证,但无法将模型泄露追溯到特定的恶意客户端;(2)基于VAE的水印容易被移除,仅需用干净的解码器替换即可。在本文中,我们提出FedOT,这是第一个用于联邦LDM的所有权验证和泄露溯源框架。具体地,为应对第一个挑战,我们设计了一种分块水印,第一部分用于所有权验证,第二部分用于客户端识别。此外,为克服第二个挑战并保护模型免受VAE替换攻击,我们引入了潜在向量变换(LVT),通过修改VAE的原始潜在分布来加强VAE和U-Net潜在空间之间的联系。因此,任何移除水印而替换VAE的尝试都会导致图像质量显著下降,使LDM模型无法使用。大量实验表明,FedOT在所有权的验证和可追踪性方面均取得了优越的性能。项目页面:https://spyzixuan.github.io/FedOT/。
查看原文
查看缓存全文

缓存时间: 2026/06/24 05:46

论文页面 - FedOT:面向联邦潜在扩散模型的版权验证与泄露溯源水印方案

来源:https://huggingface.co/papers/2606.22875

摘要

FedOT 是一个新颖的框架,通过引入分块水印和潜在向量变换,在联邦潜在扩散模型中实现版权验证与泄露溯源,从而有效防范水印移除攻击。

在联邦学习(FL)框架内训练潜在扩散模型(LDM)日益受到关注,因为它将 LDM 强大的生成能力与 FL 的隐私保护特性相结合。然而,FL 需要与多个参与者共享全局模型,这带来了恶意客户端未经授权分发或转售模型的风险。虽然一种直观的方法是采用现有的基于 VAE 的水印技术用于 FL 中的 LDM,但这种策略在应对此类威胁时存在不足,原因在于两个根本性挑战:(1)现有方法支持版权验证,但缺乏将模型泄露溯源到特定恶意客户端的能力;(2)基于 VAE 的水印脆弱易攻,只需用干净的解码器替换即可移除水印。在本文中,我们提出了 FedOT,这是首个在联邦 LDM 中实现版权验证与泄露溯源的框架。具体而言,针对第一个挑战,我们设计了一种分块水印,第一部分用于版权验证,第二部分用于客户端身份识别。此外,为克服第二个挑战并保护模型免受 VAE 替换攻击,我们引入了潜在向量变换(LVT),通过修改 VAE 的原始潜在分布,加强了 VAE 与 U-Net 潜在空间之间的连接。因此,任何试图替换 VAE 以移除水印的行为都将导致图像质量严重下降,从而使 LDM 模型无法使用。大量实验表明,FedOT 在版权验证和可溯源性方面均表现出卓越性能。项目页面:https://spyzixuan.github.io/FedOT/。

查看 arXiv 页面(https://arxiv.org/abs/2606.22875)查看 PDF(https://arxiv.org/pdf/2606.22875)项目页面(https://spyzixuan.github.io/FedOT)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.22875)

将本文档加入您的智能体:

hf papers read 2606.22875

没有最新 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用本文的模型 0

暂无模型关联本文

请在模型 README.md 中引用 arxiv.org/abs/2606.22875 以从本页面链接。

引用本文的数据集 0

暂无数据集关联本文

请在数据集 README.md 中引用 arxiv.org/abs/2606.22875 以从本页面链接。

引用本文的 Space 0

暂无 Space 关联本文

请在 Space README.md 中引用 arxiv.org/abs/2606.22875 以从本页面链接。

包含本文的收藏集 0

暂无收藏集包含本文

请将本文添加到收藏集(https://huggingface.co/new-collection)以从本页面链接。

相似文章

针对封闭 LLM 的可证明检测的数据集水印

arXiv cs.LG

本文提出了一种针对封闭大型语言模型(LLM)的新型数据集水印方法。该方法利用词对共现模式,能够以可证明的方式检测模型训练是否使用了专有数据,即使这些数据在训练数据集中仅占极小比例。

线性集成消除水印:论LLM中分布扰动的脆弱性

arXiv cs.CL

本文揭示了LLM水印的一个基本漏洞:当用户能够访问多个模型时,对其输出分布进行平均会抵消水印扰动,从而规避检测。作者提出了WASH方法,并通过实验证明,对3-5个模型进行平均可将检测z分数抑制在阈值以下,同时提升文本质量。

语言感知的非失真性LLM水印

arXiv cs.CL

介绍了LUNA,一种语言感知的LLM水印方法,实现了跨多语言的非失真嵌入和无模型检测,显著提升了AUROC和困惑度保持。