MirrorPPR:基于示例的人像照片修图

Hugging Face Daily Papers 论文

摘要

MirrorPPR 提出了一种基于示例的人像修图框架,采用带有 LoRA 适应的扩散变换器和自增强训练数据,实现了卓越的质量和身份保持。

尽管文本引导的图像编辑已取得显著进展,但在结构性人像修图方面仍存在局限。文本描述难以传达面部特征和身体比例的细微变化。为解决这一问题,我们引入了基于示例的人像照片修图任务,即给模型提供一对修图示例,使其推断并对新的查询图像应用相同的修图操作。现有的基于示例的编辑方法主要关注具有明显视觉变换的任务。相比之下,结构性人像修图涉及极其精细和局部的修改,使得精确提取和迁移这些编辑操作具有挑战性。为此,我们提出了 MirrorPPR,一种旨在捕捉和迁移细微结构性修图操作的新型框架。我们的方法使用修图操作提取器(Retouching Operation Extractor)从示例对中捕捉细微差异,然后通过连接器和低秩适应(LoRA)模块将提取的表征注入预训练的扩散变换器(DiT)。此外,构建完美对齐的跨身份训练对因操作不对齐而严重受阻。为克服这一问题,我们提出了一种先进的数据自增强范式,确保修图操作严格对齐。为缓解数据稀缺并支持这一新任务,我们推出了 MirrorPPR47M,一个包含超过4700万修图对的大规模数据集。通过将数据集分为模拟和专业两个子集,我们实现了渐进式课程学习,以平滑优化网络。大量实验表明,MirrorPPR 在修图质量和身份保持方面均显著优于现有基线。项目页面位于 https://sjtu-deng-lab.github.io/MirrorPPR。
查看原文
查看缓存全文

缓存时间: 2026/06/30 23:38

论文页面 - MirrorPPR:基于范例的人像照片修图

来源:https://huggingface.co/papers/2606.29308

摘要

基于范例的人像修图框架,采用扩散Transformer结合LoRA适配和自增强训练数据,实现了卓越的修图质量和身份保持能力。

虽然文本引导的图像编辑(https://huggingface.co/papers?q=dit)取得了显著进展,但在结构性人像修图方面仍存在局限。文本描述难以传达面部特征和身体比例的细微变化。为弥补这一不足,我们引入了基于范例的人像照片修图任务:模型给定一对修图范例,需要推断并对新的查询图像应用相同的修图操作。现有的基于范例的编辑(https://huggingface.co/papers?q=exemplar-based%20editing)方法主要关注视觉效果明显的变换任务。相比之下,结构性人像修图涉及极其精细和局部的修改,使得准确提取和迁移这些编辑(https://huggingface.co/papers?q=dit)操作极具挑战性。为此,我们提出MirrorPPR,一个旨在捕获和迁移细微结构性修图操作的新型框架。我们的方法使用修图操作提取器(https://huggingface.co/papers?q=Retouching%20Operation%20Extractor)来捕获范例对中的细微差异。提取的表示随后通过连接器和低秩适配(https://huggingface.co/papers?q=Low-Rank%20Adaptation)(LoRA(https://huggingface.co/papers?q=LoRA))模块注入预训练的扩散Transformer(https://huggingface.co/papers?q=Diffusion%20Transformer)(DiT(https://huggingface.co/papers?q=DiT))中。此外,构建完美对齐的跨身份训练对(https://huggingface.co/papers?q=cross-identity%20training%20pairs)因操作不对齐而严重受阻。为解决此问题,我们提出一种先进的数据自增强(https://huggingface.co/papers?q=data%20self-augmentation)范式,确保修图操作严格对齐。为缓解数据稀缺并支持这一新任务,我们引入MirrorPPR47M数据集,包含超过4700万个修图对。通过将数据集划分为模拟子集和专业子集,我们实现了渐进式课程学习(https://huggingface.co/papers?q=curriculum%20learning),以平滑优化网络。大量实验表明,MirrorPPR在修图质量和身份保持方面均显著优于现有基线。项目页面可见https://sjtu-deng-lab.github.io/MirrorPPR。

查看arXiv页面(https://arxiv.org/abs/2606.29308)查看PDF(https://arxiv.org/pdf/2606.29308)项目页面(https://sjtu-deng-lab.github.io/MirrorPPR)GitHub3(https://github.com/SJTU-DENG-Lab/MirrorPPR)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.29308)

在您的Agent中获取此论文:

hf papers read 2606\.29308

没有最新的CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

无模型链接此论文

请在模型README.md中引用arxiv.org/abs/2606.29308以从此页面链接。

引用此论文的数据集0

无数据集链接此论文

请在数据集README.md中引用arxiv.org/abs/2606.29308以从此页面链接。

引用此论文的Spaces0

无Space链接此论文

请在Space README.md中引用arxiv.org/abs/2606.29308以从此页面链接。

包含此论文的收藏集0

无收藏集包含此论文

请将此论文添加到一个收藏集(https://huggingface.co/new-collection)中以从此页面链接。

相似文章

prunaai/p-image-edit

Replicate Explore

Pruna的p-image-edit是一款运行在Replicate平台上的高端AI模型,能够在一秒内快速完成业界领先的图像编辑,兼具速度、经济性和高视觉质量,精准遵循提示词并具备强大的文字渲染能力。