当 Fast Fourier Transform 遇见 Transformer:图像恢复(2024)
摘要
SFHformer将Fast Fourier Transform引入Transformer架构,实现高效的图像恢复,在去雨、去雾、超分辨率等十个任务上达到最先进水平。该论文被ECCV 2024接收,其扩展版本SWFormer于2025年发布。
查看缓存全文
缓存时间: 2026/05/20 14:27
网络架构
实验结果
针对不同的图像恢复任务进行了实验,包括图像去雾、图像去雨、图像去雪、图像去噪、图像超分辨率、单图像运动去模糊、散焦去模糊、图像雨滴去除、低光照图像增强和水下图像增强。
相似文章
面向金融欺诈检测的多流时序融合
提出用于金融欺诈检测的多流欺诈Transformer(MSFT),该模型使用Transformer独立编码交易、登录和风险事件流,并通过时间感知位置编码和门控融合进行融合,在大型数据集上实现了0.9961的AUROC。
ViT-Up: 视觉Transformer的忠实特征上采样
ViT-Up提出了一种用于视觉Transformer的任务无关特征上采样器,在任意连续图像坐标上预测特征,从而能够生成任意分辨率的密集特征图,并提升了密集预测和语义对应基准的性能。它优于先前的最先进上采样器,在Cityscapes上提升了+2.07 mIoU,在SPair-71k上提升了+4.17 [email protected]。
FFAvatar: 少样本、前馈、可泛化的头像重建
FFAvatar提出了一种前馈框架,能在数秒内从少量非摆拍图像中重建高质量、可动画的3D高斯头部头像,在NeRSemble基准测试上相比现有最优方法实现了5.5 PSNR的提升。
RF-DETR:面向实时检测Transformer的神经架构搜索
RF-DETR提出了一种轻量级检测Transformer,通过权重共享神经架构搜索实现最先进的实时目标检测,在COCO和Roboflow100-VL上优于先前方法,同时运行速度快达20倍。
SRT:基于解耦校正流的时间序列超分辨率
本文提出 SRT(时间序列超分辨率),一种使用解耦校正流方法从低分辨率输入重建高分辨率时间模式的框架。该方法将输入分解为趋势和季节性成分,应用隐式神经表示进行分辨率对齐,并引入跨分辨率注意力机制以生成细粒度细节,在多个数据集上实现了最先进的性能。