LLM匿名化对抗代理性重新识别

Hugging Face Daily Papers 论文

摘要

AURA是一个基于LLM的匿名化框架,通过自适应隐私范围和mask-reconstruct方法在保护隐私以抵抗代理性网络搜索重新识别的同时,保持上下文效用,从而平衡隐私保护与效用保持。

具有网络搜索能力的代理性LLM改变了文本匿名化的威胁模型:弱上下文线索可能成为重新识别的可交叉引用证据,但这些细节同时也承载文本的下游分析价值。现有防御要么移除显式标识符,要么扰动文本以实现正式隐私,要么针对非网络推理模型测试重写后的文本,却未充分探索在抵抗代理性网络搜索重新识别与效用保持之间的操作区域。我们提出了AURA(Anonymization with Utility-Retention Adaptation),一个基于LLM的mask-reconstruct框架,该框架将隐私定位与效用保持重建解耦,并通过对抗性隐私和效用保持检查选择候选。我们在真实用户访谈记录上评估了AURA,使用了由网络搜索代理执行的重新识别攻击,以及基于受访者档案事实、编码本事实和联合上下文效用网格的效用评估。结果表明,AURA通过使用自适应隐私范围增强对代理性重新识别的抵抗性,并在固定隐私范围下使用mask-reconstruct匿名化方法更好地保持上下文效用,从而改进了隐私-效用边界。
查看原文
查看缓存全文

缓存时间: 2026/06/05 18:09

论文页面 - LLM匿名化对抗智能体再识别

来源:https://huggingface.co/papers/2605.30848

摘要

AURA 是一个基于 LLM 的匿名化框架,旨在通过自适应隐私作用域和掩码-重构方法,在保护隐私以抵御智能体网络搜索再识别的同时,保留上下文效用。

具备网络搜索能力的智能体 LLM 改变了文本匿名化的威胁模型:微弱的上下文线索可能成为可交叉引用的再识别证据,但同样的细节也承载着文本下游分析的价值。现有防御措施要么移除显式标识符,要么为正式隐私扰动文本,要么针对非网络推理模型测试改写后的文本,却未充分探索在抵抗智能体网络搜索再识别与保留效用之间的操作区间。我们提出了 AURA(具有效用保留自适应的匿名化框架),这是一个基于 LLM 的掩码-重构框架,将隐私定位与效用保留重构解耦,并通过对抗性隐私和效用保留检查选择候选方案。我们在真实用户访谈记录上,使用网络搜索代理执行的再识别攻击评估了 AURA,同时基于受访者档案事实、编码手册事实以及联合上下文效用网格进行效用评估。我们的结果表明,AURA 通过使用自适应隐私作用域增强了抵抗智能体再识别的能力,并通过在固定隐私作用域下使用掩码-重构匿名化方法更好地保留了上下文效用,从而改善了隐私-效用前沿。

查看 arXiv 页面 (https://arxiv.org/abs/2605.30848)
查看 PDF (https://arxiv.org/pdf/2605.30848)
项目页面 (https://peach-research-lab.github.io/AURA/)
GitHub (https://github.com/PEACH-Research-Lab/AURA)
添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.30848)

引用本文的模型:0

没有模型链接本文

请在模型的 README.md 中引用 arxiv.org/abs/2605.30848 以从本页链接到它。

引用本文的数据集:0

没有数据集链接本文

请在数据集的 README.md 中引用 arxiv.org/abs/2605.30848 以从本页链接到它。

引用本文的 Spaces:0

没有 Space 链接本文

请在 Space 的 README.md 中引用 arxiv.org/abs/2605.30848 以从本页链接到它。

包含本文的收藏:0

没有包含本文的收藏

请将本文添加到一个收藏 (https://huggingface.co/new-collection) 以从本页链接到它。

相似文章