layer-separation

标签

Cards List
#layer-separation

Stable-Layers:使用VLM评分的强化学习微调图像层分解模型

Hugging Face Daily Papers · 2026-05-28

Stable-Layers是一个强化学习框架,它利用VLM反馈而非配对监督来微调预训练的图层分解模型,采用Flow-GRPO与LoRA以及两阶段奖励校准流程,在Crello数据集上提升图层质量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈