LLM匿名化对抗代理性重新识别
摘要
AURA是一个基于LLM的匿名化框架,通过自适应隐私范围和mask-reconstruct方法在保护隐私以抵抗代理性网络搜索重新识别的同时,保持上下文效用,从而平衡隐私保护与效用保持。
查看缓存全文
缓存时间: 2026/06/05 18:09
论文页面 - LLM匿名化对抗智能体再识别
来源:https://huggingface.co/papers/2605.30848
摘要
AURA 是一个基于 LLM 的匿名化框架,旨在通过自适应隐私作用域和掩码-重构方法,在保护隐私以抵御智能体网络搜索再识别的同时,保留上下文效用。
具备网络搜索能力的智能体 LLM 改变了文本匿名化的威胁模型:微弱的上下文线索可能成为可交叉引用的再识别证据,但同样的细节也承载着文本下游分析的价值。现有防御措施要么移除显式标识符,要么为正式隐私扰动文本,要么针对非网络推理模型测试改写后的文本,却未充分探索在抵抗智能体网络搜索再识别与保留效用之间的操作区间。我们提出了 AURA(具有效用保留自适应的匿名化框架),这是一个基于 LLM 的掩码-重构框架,将隐私定位与效用保留重构解耦,并通过对抗性隐私和效用保留检查选择候选方案。我们在真实用户访谈记录上,使用网络搜索代理执行的再识别攻击评估了 AURA,同时基于受访者档案事实、编码手册事实以及联合上下文效用网格进行效用评估。我们的结果表明,AURA 通过使用自适应隐私作用域增强了抵抗智能体再识别的能力,并通过在固定隐私作用域下使用掩码-重构匿名化方法更好地保留了上下文效用,从而改善了隐私-效用前沿。
查看 arXiv 页面 (https://arxiv.org/abs/2605.30848)
查看 PDF (https://arxiv.org/pdf/2605.30848)
项目页面 (https://peach-research-lab.github.io/AURA/)
GitHub (https://github.com/PEACH-Research-Lab/AURA)
添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.30848)
引用本文的模型:0
没有模型链接本文
请在模型的 README.md 中引用 arxiv.org/abs/2605.30848 以从本页链接到它。
引用本文的数据集:0
没有数据集链接本文
请在数据集的 README.md 中引用 arxiv.org/abs/2605.30848 以从本页链接到它。
引用本文的 Spaces:0
没有 Space 链接本文
请在 Space 的 README.md 中引用 arxiv.org/abs/2605.30848 以从本页链接到它。
包含本文的收藏:0
没有包含本文的收藏
请将本文添加到一个收藏 (https://huggingface.co/new-collection) 以从本页链接到它。
相似文章
AURA: 情境化LLM智能体中隐式需求的意图导向探询
AURA 引入了一个意图导向的探询步骤,使LLM智能体能够浮现情境化查询背后的隐式用户需求,在基准测试上提高了覆盖率,同时减少了不必要的工具调用并防止了隐私侵犯。
LLM-FACETS:一种用于评估LLM透明度与问责制的隐私保护框架
LLM-FACETS 是一个开源评估框架,旨在帮助从业者评估LLM的透明度与问责制,重点关注隐私和数据流透明度。它提供浏览器界面和插件架构,支持多种审计机制,包括令牌级对数概率可视化和 RAG Triad 指标。
多智能体LLM能否识别其同行?角色约束政治分析中的风格化指纹识别
本文研究了LLM是否能够从角色约束政治分析文本中的风格化指纹识别出自己的模型家族,即使在提示层面匿名化后也是如此。研究结果证实匿名化不足,并对欧盟AI法案合规性和多智能体系统验证有影响。
PrivacyAkinator: 通过回答LLM生成的多选题阐述关键隐私设计决策
本文介绍了PrivacyAkinator,一个交互式工具,帮助新手开发者通过LLM生成的多选题来阐述隐私设计决策,与NIST的PRAM方法相比,在减少73%的时间的同时,识别出多47%的关键决策。
LLM-as-a-Discriminator:当合成表格看起来仍然真实
本文提出了一种基于LLM鉴别的方法,用于审计合成表格数据的隐私,通过让LLM将样本分类为真实或合成,表明LLM鉴别可以作为一种实用的隐私审计信号。