SloMoDeblur
收藏arXiv2025-06-24 更新2025-11-28 收录
下载链接:
https://hf-mirror.com/datasets/masterda/SloMoBlur
下载链接
链接失效反馈官方服务:
资源简介:
SloMoDeblur是一个基于智能手机慢动作视频构建的大型真实世界图像去模糊数据集。该数据集包含超过42,000对高分辨率模糊-清晰图像,比广泛使用的类似数据集大10倍,涵盖了8倍不同的场景,包括室内和室外环境,以及不同的物体和相机运动。该数据集的创建是为了模拟真实场景下的长曝光模糊,使用iPhone的240 fps慢动作功能,通过平均一秒内捕获的240帧来生成模糊图像,并以时间上居中的帧作为清晰的参考。该数据集旨在作为图像去模糊模型的挑战性新基准,以促进鲁棒和通用的去模糊模型的发展。
SloMoDeblur is a large-scale real-world image deblurring dataset built from smartphone slow-motion videos. It contains over 42,000 high-resolution blurry-sharp image pairs, which is 10 times larger than widely used comparable datasets, and covers eight distinct scene categories including indoor and outdoor environments, as well as various object and camera motions. This dataset is designed to simulate long-exposure blur in real-world scenarios: it utilizes the 240 fps slow-motion function of iPhones, generates blurry images by averaging 240 frames captured within one second, and uses the temporally centered frame as the sharp reference. It aims to serve as a challenging new benchmark for image deblurring models to promote the development of robust and general-purpose deblurring models.
提供机构:
达卡大学
创建时间:
2025-06-24
搜集汇总
数据集介绍

构建方式
SloMoDeblur数据集旨在为真实世界图像去模糊研究提供大规模、高保真的训练与评测基准。其构建依托于iPhone 15 Pro的240帧/秒慢动作视频录制能力,通过将连续30帧(对应约1/8秒模拟曝光时间)的像素值进行累加平均,合成具有真实运动模糊效果的图像,同时选取时间窗口内的中心帧作为清晰参考真值。该流程确保了模糊与清晰图像在空间与时间上的严格对齐,并避免了传统合成方法中复杂的相机响应函数建模。全部视频序列以1920×1080分辨率采集,最终生成超过42,000对高分辨率模糊-清晰图像对,涵盖843个多样化场景。
特点
该数据集在规模与多样性上显著超越现有基准,其图像对数量约为GoPro数据集的10倍,场景数量达8倍以上。数据采集使用消费级智能手机,真实反映了日常摄影中传感器尺寸有限、计算摄影管线复杂等成像特性,使模糊模式更贴近实际应用场景。数据集囊括了人体运动、物体位移、相机抖动等多种运动类型,以及线性、旋转、遮挡和非均匀深度变化引起的复杂模糊,同时保留了真实的噪声水平与色调映射特征。这些特性使其成为评估去模糊模型泛化能力的严峻挑战。
使用方法
数据集已公开在Hugging Face平台,并随附完整的生成脚本,便于研究者复现与扩展。用户可直接下载预制的模糊-清晰图像对,用于有监督训练和测试。建议按照论文提供的训练/测试划分(约37,841对用于训练,4,204对用于测试)进行实验。该数据集特别适用于评估和提升基于Transformer、状态空间模型及频域处理等先进架构在真实场景下的去模糊性能。研究者亦可利用其高帧率视频源,探索基于时序或运动先验的去模糊方法。
背景与挑战
背景概述
图像去模糊是计算机视觉领域一项基础且具有挑战性的任务,旨在从退化图像中恢复潜在的清晰影像。运动模糊作为最常见的退化形式,其成因复杂,包括物体快速移动、相机抖动以及景深变化等。为应对这一挑战,达卡大学的研究团队于2025年提出了SloMoDeblur数据集,该数据集利用iPhone 15 Pro的240帧/秒慢动作视频,通过帧平均模拟长时间曝光模糊,并选取中间帧作为锐利参考,构建了超过42,000对高分辨率模糊-清晰图像对,覆盖843个室内外场景。其规模约为GoPro数据集的十倍,场景多样性提升八倍,填补了现有数据集在规模、真实性和领域相关性上的关键空白,为训练鲁棒且泛化能力强的去模糊模型提供了全新基准。
当前挑战
该数据集所解决的领域问题在于,现有去模糊模型在真实场景中表现欠佳,尤其是面对非均匀运动模糊时,泛化能力严重不足。构建过程中面临的核心挑战包括:确保模糊图像与锐利参考图像在几何和光度上的精确对齐,因为相机运动本身是引入模糊的必要条件,却会破坏空间一致性;同时,数据集需真实反映常见运动模糊场景,并最小化参考图像中的噪声干扰。此外,使用消费级智能手机而非专业相机,虽提升了数据集的现实相关性,但也引入了更复杂的模糊模式,对模型提出了更高要求。
常用场景
经典使用场景
在图像去模糊领域,SloMoDeblur数据集凭借其超过42,000对高分辨率模糊-清晰图像对的庞大规模,以及对真实世界运动模糊的精准模拟,成为训练和评估深度学习去模糊模型的核心基准。该数据集通过iPhone 15 Pro的240帧/秒慢动作视频,利用帧平均法合成长时间曝光模糊,并选取中间帧作为清晰参考,完美复现了手持摄影中常见的非均匀运动模糊。研究者普遍将其作为替代传统合成数据集(如GoPro、HIDE)的首选,用于检验模型在复杂动态场景下的泛化能力,尤其是在智能手机成像特性下的表现。
解决学术问题
SloMoDeblur数据集解决了现有基准在规模、真实性和领域相关性上的关键局限。传统合成数据集(如GoPro)仅含数千对图像,且场景单一,导致模型在真实世界中的泛化能力不足;而真实数据集(如RealBlur)受限于采集设备的高品质,无法反映消费级智能手机的成像特性。该数据集通过大规模、多样化的843个场景覆盖,以及智能手机传感器的固有噪声与处理管线,揭示了当前最先进模型(如Restormer、FFTformer)在真实模糊条件下的显著性能下降,从而推动了更鲁棒、更通用的去模糊算法研究。其提出的挑战性基准促使学术界重新审视模型假设,并催生了面向真实部署场景的新方法。
衍生相关工作
SloMoDeblur数据集的出现催生了多项具有影响力的衍生工作。在模型架构方面,研究者基于该数据集开发了适应智能手机成像特性的轻量级去模糊网络,如融合频率域处理的DeepRFT+和利用状态空间模型的Mamba架构,这些工作显著提升了在真实场景下的效率与精度。在训练策略上,该数据集促进了自监督学习和测试时自适应方法的探索,例如通过运动元数据引导的物理信息去模糊模型。此外,该数据集还被用于跨任务统一框架的构建,将去模糊与去噪、超分辨率联合优化,推动了图像恢复领域的整体进步。其公开的生成脚本也鼓励了社区对数据增强和域适应技术的创新。
以上内容由遇见数据集搜集并总结生成



