five

ERF-X170FPS

收藏
arXiv2025-02-19 更新2025-02-21 收录
下载链接:
https://github.com/intelpro/CBMNet
下载链接
链接失效反馈
官方服务:
资源简介:
ERF-X170FPS数据集是由韩国科学技术院的研究团队创建的一个大规模事件驱动视频帧插值数据集。该数据集具有高帧率(170fps)、高分辨率(1440×975)和更多样化的场景,克服了现有事件驱动VFI数据集的低帧率、静态摄像机移动等局限性。数据集包含了训练和测试分割,可用于事件驱动视频帧插值研究。

The ERF-X170FPS dataset is a large-scale event-driven video frame interpolation dataset developed by a research team from the Korea Advanced Institute of Science and Technology (KAIST). Featuring a high frame rate of 170fps, a resolution of 1440×975, and more diverse scenarios, this dataset overcomes the limitations of existing event-driven VFI datasets, such as low frame rates and static camera movements. The dataset includes training and testing splits, which can be utilized for research on event-driven video frame interpolation.
提供机构:
韩国科学技术院(Korea Advanced Institute of Science and Technology)
创建时间:
2025-02-19
搜集汇总
数据集介绍
main_image_url
构建方式
ERF-X170FPS数据集的构建旨在克服现有基于事件的视频帧插值(VFI)数据集的局限性。该数据集使用基于分束器的相机设置,包括Prophesee Gen4事件相机和Blackfly-S全局快门相机,以捕获具有高帧率(170fps)和高分辨率(1440×975)的视频。此外,数据集涵盖了多样化的场景,包括可变形和快速移动的物体、静态场景以及驾驶场景,以提供更全面的测试环境。这些特点使得ERF-X170FPS数据集成为评估和训练基于事件VFI算法的理想选择。
特点
ERF-X170FPS数据集具有几个显著的特点。首先,它具有高帧率(170fps),这使得它能够捕捉极端运动和动态纹理,从而克服了低帧率数据集中常见的大遮挡问题。其次,数据集具有高分辨率(1440×975),提供了更丰富的视觉信息,有助于更准确地估计运动场。此外,数据集涵盖了多样化的场景,包括可变形和快速移动的物体、静态场景以及驾驶场景,从而为基于事件的VFI算法提供了更全面的测试环境。最后,数据集的训练和测试分割都是公开可用的,方便研究人员进行评估和比较。
使用方法
ERF-X170FPS数据集可用于评估和训练基于事件的视频帧插值(VFI)算法。研究人员可以使用该数据集来训练和测试他们的VFI模型,并通过与其他方法的性能比较来评估其有效性。此外,数据集的公开可用的训练和测试分割使得研究人员可以轻松地进行基准测试和比较。为了使用ERF-X170FPS数据集,研究人员需要从数据集的官方网站下载数据集,并根据其研究需求进行处理和标注。
背景与挑战
背景概述
视频帧插值(VFI)是计算机视觉中的一个经典问题,旨在在连续的输入帧之间生成中间视频帧。由于事件相机是一种受生物启发的传感器,它仅以微秒时间分辨率编码亮度变化,因此许多研究利用事件相机来提高VFI的性能。然而,现有方法仅使用事件或近似值来估计双向帧间运动场,这无法考虑现实世界场景中的复杂运动。在这篇论文中,我们提出了一种新的基于事件的VFI框架,该框架具有跨模态非对称双向运动场估计功能。具体来说,我们的EIF-BiOFNet利用事件和图像的每个有价值的特征,直接估计帧间运动场,而不需要任何近似方法。此外,我们开发了一个交互式注意力帧合成网络,以有效地利用基于扭曲和基于合成的互补特征。最后,我们构建了一个大规模的事件驱动VFI数据集ERFX170FPS,具有高帧率、极端运动和动态纹理,以克服以前基于事件的VFI数据集的限制。广泛的实验结果表明,我们的方法在各种数据集上显著优于最先进的VFI方法。我们的项目页面可在https://github.com/intelpro/CBMNet上找到。
当前挑战
事件相机是一种新型的传感器,具有高时间分辨率和HDR特性,可以捕获帧之间的盲运动。然而,由于事件的稀疏性和噪声性,以及所有亮度变化都没有被记录在事件流中,这导致了不准确的结果。此外,基于近似的方法无法完全表达复杂现实世界运动场的运动模型。最后,以前的工作没有充分利用图像提供的密集视觉信息;以前的工作没有考虑两种模态之间的显着区别,例如简单地连接两种模态的特征。为了解决这个问题,我们提出了一个新颖的EIF-BiOFNet(事件-图像融合双向光流网络),用于直接估计非对称帧间运动场,精心考虑事件和帧的特征,而不使用近似方法。此外,现有的基于事件的VFI数据集存在一些限制,例如未公开的训练分割、低帧率和静态相机运动。为了解决这些问题,我们构建了一个名为ERF-X170FPS的大型数据集,具有高帧率(170fps)、高分辨率(1440x975)和更多样化的场景,与基于事件的VFI数据集[44]相比,其中包括公开的训练和测试分割。
常用场景
经典使用场景
ERF-X170FPS数据集主要用于事件相机驱动的视频帧插值研究,该数据集提供了高帧率(170fps)、高分辨率(1440×975)和多样化的场景,包括可变形物体和快速运动的物体。这使得ERF-X170FPS成为评估事件相机在视频帧插值任务中的性能的理想选择。
解决学术问题
ERF-X170FPS数据集解决了现有事件相机视频帧插值数据集的局限性,如低帧率、静态相机运动和有限的场景多样性。通过提供高帧率和高分辨率的数据,ERF-X170FPS使得研究者能够更好地评估和训练事件相机视频帧插值算法,从而提高算法在复杂场景下的性能。
衍生相关工作
ERF-X170FPS数据集的发布促进了事件相机视频帧插值领域的研究进展。基于该数据集,研究者可以开发出更精确、更高效的视频帧插值算法,从而推动事件相机在计算机视觉和机器学习领域的应用。此外,ERF-X170FPS数据集还可以用于评估其他事件相机相关算法的性能,如运动估计、场景重建和目标跟踪等。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作