朝向校准、公平且准确的深度伪造检测

arXiv cs.LG 论文

摘要

介绍Face-Fairness (FF),一种用于深度伪造检测中偏见缓解的即插即用框架,其中Face-Feature Tuning (FFT)作为首个无需人口统计标签的公平性方法,能够提升群体准确率并缩小不同人口统计群体间的性能差距。

arXiv:2606.09881v1 公告类型:新论文 摘要:深度伪造检测器在不同人口统计群体间存在较大的性能差距。现有的公平性方法需要人口统计标签、重新训练或牺牲准确率。我们提出Face-Fairness (FF),一种用于偏见缓解的即插即用框架。我们最主要的贡献是Face-Feature Tuning (FFT),这是首个在深度伪造检测中无需人口统计标签的公平性方法:一个轻量级校准器,通过对冻结的人脸嵌入进行条件逻辑回归映射。我们为FF提供了两种变体:FF-Max,在人口统计标签可用时最大化最差群体准确率;以及FF-Discover,通过嵌入发现群体实现相同目标。在域内和跨数据集测试设置下,FF一致地降低了FPR/TPR差距并提高了最小群体准确率,同时保持了(通常提升了)整体准确率。该方法与检测器无关,增加了可忽略的运行时开销,且无需访问身份属性。
查看原文
查看缓存全文

缓存时间: 2026/06/10 06:15

# 迈向校准、公平且精准的深度伪造检测
来源:https://arxiv.org/abs/2606.09881
查看 PDF(https://arxiv.org/pdf/2606.09881)

> **摘要:**深度伪造检测器在不同人群组之间表现出巨大的性能差距。现有的公平性方法需要人口统计标签、重新训练或牺牲准确率。我们提出 Face-Fairness(FF),一个即插即用的偏差缓解框架。我们的主要贡献在于 Face-Feature Tuning(FFT),这是首个无需人口统计标签的深度伪造检测公平性方法:一个轻量级校准器,基于冻结的人脸嵌入进行 logit 重映射。我们还为 FFT 补充了两种变体:FF-Max,在拥有人口统计信息时最大化最差组准确率;以及 FF-Discover,通过嵌入发现的分组实现相同目标。在领域内和跨数据集测试场景中,FF 持续降低 FPR/TPR 差距并提升最小分组准确率,同时保持(通常提升)整体准确率。该方法与检测器无关,仅增加可忽略的运行时开销,且无需访问身份属性。

## 提交历史

来自:Ryan Brown \[查看邮件(https://arxiv.org/show-email/f8990f23/2606.09881)\] **\[v1\]** 2026年6月3日,星期三 05:44:29 UTC(407 KB)

相似文章

Alpha 混合假说:深度伪造检测中的合成捷径

Hugging Face Daily Papers

本文提出了 Alpha 混合假说,认为深度伪造检测器主要识别的是图像合成伪影,而非语义异常。文章提出了一种名为 BlenD 的方法,通过仅使用真实图像并与自混合图像进行数据增强,实现了卓越的跨数据集泛化能力。

通过将公平性视为对称操作来检测和缓解偏见

arXiv cs.AI

本文提出将公平性视为机器学习分类器中的对称操作,通过基于损失的规范化来实现在固定能力特征的同时,交换敏感属性时的不变性。该框架实现了超过90%的偏见减少,且准确率损失极小,无需因果图知识。

在日用设备上启用隐私保护型 AI 训练

MIT News — Artificial Intelligence

麻省理工学院研究人员开发了一种名为 FTTE 的新框架,将隐私保护型联邦学习的速度提升了 81%,使得在智能手表和传感器等资源受限的边缘设备上高效进行 AI 训练成为可能。