five

BSD

收藏
arXiv2022-10-15 更新2024-06-21 收录
下载链接:
https://github.com/zzh-tech/ESTRNN
下载链接
链接失效反馈
官方服务:
资源简介:
BSD数据集是由东京大学等机构创建的第一个真实世界视频去模糊数据集,通过共轴分束器采集系统收集了模糊/清晰视频片段对。该数据集包含三种不同模糊强度配置,涵盖了多种自我运动和物体运动类型,适用于动态场景下的视频去模糊研究。数据集的创建过程涉及精确的曝光时间和强度控制,以确保模糊和清晰视频对的高质量同步采集。BSD数据集的应用领域主要集中在视频去模糊技术,旨在解决真实世界视频中的模糊问题,提高视频清晰度和视觉质量。

The BSD Dataset is the first real-world video deblurring dataset developed by institutions including the University of Tokyo. It acquires paired blurred and sharp video clips through a coaxial beam splitter-based acquisition system. This dataset encompasses three distinct blur intensity configurations, covering a wide range of self-motion and object motion types, making it suitable for video deblurring research in dynamic scenarios. The development of the BSD Dataset involves precise control over exposure time and intensity, ensuring high-quality synchronous acquisition of blurred and sharp video pairs. The primary application scope of the BSD Dataset lies in video deblurring technology, where it aims to address blur issues in real-world videos and improve overall video clarity and visual quality.
提供机构:
东京大学
创建时间:
2021-06-30
搜集汇总
数据集介绍
main_image_url
构建方式
在视频去模糊领域,构建高质量数据集一直面临真实模糊与清晰图像对难以获取的挑战。BSD数据集通过创新的同轴分束采集系统,实现了真实世界模糊与清晰视频对的同步捕获。该系统采用两台相机,通过分束器同轴对齐,并采用中心对齐的曝光方案,确保模糊曝光时间完全覆盖清晰曝光时间,从而在动态场景中精确采集配对的模糊与清晰视频序列。数据采集涵盖了三种不同的模糊强度设置,包括1ms-8ms、2ms-16ms和3ms-24ms的曝光时间配置,总计包含100个视频序列,每个序列具有100至150帧,分辨率统一为640×480,帧率为15fps。
使用方法
BSD数据集主要用于视频去模糊模型的训练、验证与测试。研究人员可将数据集划分为训练集、验证集和测试集,其中训练集包含60个序列,验证集和测试集分别包含20个序列。在使用时,模型以模糊视频帧作为输入,对应的清晰帧作为真实标签,通过优化如MSE损失或Charbonnier损失等目标函数来学习去模糊映射。数据集支持多种深度学习框架,并可通过数据增强技术(如随机裁剪和翻转)提升模型鲁棒性。此外,BSD适用于交叉验证研究,帮助评估模型在合成与真实数据间的迁移性能,推动去模糊技术在实际应用中的发展。
背景与挑战
背景概述
在计算机视觉领域,视频去模糊技术旨在恢复因相机与物体相对运动而产生的动态模糊,是提升视觉感知质量的关键环节。BSD数据集由东京大学、华为日本研究中心及国立情报学研究所的研究团队于2022年共同创建,其核心研究问题在于解决现有合成去模糊数据集因数据分布不自然所导致的模型泛化能力不足。该数据集通过同轴分束采集系统同步捕获真实世界的模糊与清晰视频对,首次为视频去模糊任务提供了高质量的真实场景基准,显著推动了数据驱动方法在实际应用中的可靠性与鲁棒性发展。
当前挑战
视频去模糊领域长期面临两大挑战:其一,动态场景中时空变化的模糊模式具有高度复杂性,同时实时处理要求低计算成本,这构成了算法设计的核心矛盾;其二,数据集的构建过程存在显著困难,传统合成方法通过平均高帧率视频模拟模糊,难以还原真实噪声分布与光学效应,导致模型在实际场景中泛化性能受限。BSD数据集的创建需克服硬件同步、曝光对齐及光学校准等工程难题,以实现模糊与清晰视频对的精确配对采集。
常用场景
经典使用场景
在计算机视觉领域,视频去模糊技术致力于恢复因相机抖动或物体运动导致的模糊帧。BSD数据集作为首个真实世界视频去模糊基准,其经典使用场景在于为深度学习模型提供高质量的模糊-清晰视频对。通过同轴分束采集系统,BSD捕捉了动态场景中不同模糊强度的真实数据,涵盖了相机自运动、物体运动及其组合模式。这一数据集使得研究者能够在接近实际应用的环境中训练和评估模型,有效模拟真实拍摄条件下的模糊特性,从而推动视频去模糊算法在复杂运动场景中的性能提升。
解决学术问题
BSD数据集主要解决了视频去模糊研究中真实数据缺失和模型泛化能力不足的学术问题。传统合成数据集通过平均高帧率视频生成模糊帧,往往存在数据分布不自然和伪影问题,导致训练模型在真实场景中表现不佳。BSD通过硬件采集系统提供真实模糊-清晰对,消除了合成数据的局限性,使模型能够学习更贴近实际的模糊模式。这不仅提升了去模糊算法的定量指标如PSNR和SSIM,还增强了模型在不同数据集间的迁移能力,为低层视觉任务提供了可靠的数据基础,推动了真实世界视频恢复研究的发展。
实际应用
BSD数据集的实际应用广泛涉及移动设备视频增强、安防监控和自动驾驶等领域。在智能手机拍摄中,低光照环境常需延长曝光时间导致运动模糊,基于BSD训练的模型可实时去模糊,提升视频质量。安防监控中,快速运动物体会产生模糊影像,利用BSD数据训练的算法能恢复细节,辅助目标识别。此外,自动驾驶系统依赖清晰视频流进行环境感知,BSD提供的真实模糊场景有助于开发鲁棒的去模糊模块,确保视觉系统在动态条件下的可靠性。这些应用体现了BSD在推动实时视频处理技术落地中的关键作用。
数据集最近研究
最新研究方向
在计算机视觉领域,视频去模糊技术正面临从合成数据向真实世界场景过渡的关键转折点。BSD数据集作为首个通过共轴分束采集系统构建的真实世界视频去模糊基准,其出现推动了该领域研究范式的革新。前沿研究聚焦于利用循环神经网络结合全局时空注意力机制,以高效融合相邻帧的层次特征,从而在低计算成本下实现更优的去模糊性能。这一进展不仅解决了合成数据分布与真实场景间的泛化鸿沟,还为移动设备实时视频增强提供了切实可行的解决方案,标志着视频恢复技术向实用化迈出了重要一步。
相关研究论文
  • 1
    Real-world Video Deblurring: A Benchmark Dataset and An Efficient Recurrent Neural Network东京大学 · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作