VIDI

Name: VIDI
Creator: 伊斯坦布尔技术大学
Published: 2022-05-26 19:30:59
License: 暂无描述

arXiv2022-05-26 更新2024-06-21 收录

下载链接：

https://github.com/vididataset/VIDI

下载链接

链接失效反馈

官方服务：

资源简介：

VIDI数据集是由伊斯坦布尔技术大学创建的一个包含4534个视频片段的大型视频数据集，涵盖43种不同的事故类别，如地震、洪水、交通事故等。每个事故类别平均包含约100个视频，视频平均时长为十秒。数据集的视频主要从YouTube收集，通过使用多种语言搜索以增加多样性。VIDI数据集的创建旨在利用视频中的时间信息提高事故分类的准确性，特别适用于研究自然灾害和事故的自动检测。通过提供丰富的视频数据，VIDI数据集支持研究者开发和评估利用时间信息的检测和分类系统。

The VIDI dataset is a large-scale video dataset created by Istanbul Technical University, containing 4,534 video clips across 43 distinct accident categories including earthquakes, floods, traffic accidents and others. Each category holds approximately 100 videos on average, with an average video duration of 10 seconds. The dataset's videos are primarily sourced from YouTube, with multilingual search strategies employed to boost diversity. The VIDI dataset was developed to leverage temporal information within videos to enhance the accuracy of accident classification, and is particularly suited for research on automated detection of natural disasters and accidents. By offering abundant video data, the VIDI dataset enables researchers to develop and evaluate detection and classification systems that utilize temporal information.

提供机构：

伊斯坦布尔技术大学

创建时间：

2022-05-26

搜集汇总

数据集介绍

构建方式

VIDI数据集的构建始于对YouTube平台上的视频内容的广泛搜索，旨在捕捉43种不同类型的事故和自然灾害。为了确保数据集的多样性，搜索涵盖了多种语言和地理位置，以反映不同文化和地区的事件特征。收集的视频片段由研究团队手动筛选和标注，以确保每个事件类别的平均视频数量约为100个，且视频时长平均为10秒。此外，为了防止无关信息对事件分类的干扰，片段被选自单一视角，并排除了突然变化的帧。在标注过程中，研究团队还允许视频片段具有多个标签，以捕捉视频中可能发生的多种事件。

特点

VIDI数据集的独特之处在于它不仅包含了广泛的事故和自然灾害类别，而且还融合了视频数据的时间信息，这是现有数据集所缺乏的。数据集中的每个视频片段都经过精心挑选，以确保它们能够代表各种事件的前后过程。此外，VIDI数据集还允许视频片段具有多个标签，这有助于研究者更好地理解事件之间的复杂关系。为了进一步丰富数据集，视频片段是从不同的语言和地理位置收集的，这为事件分类研究提供了宝贵的时间信息和地区特色。

使用方法

VIDI数据集的用途非常广泛，主要应用于计算机视觉领域的事件检测和分类。研究者可以利用该数据集来开发和评估其事件检测和分类系统，特别是那些能够利用视频数据时间信息的系统。此外，VIDI数据集还可以用于测试和比较不同的事件分类方法，如Vision Transformer和TimeSformer，以探索视频信息在事件分类中的贡献。为了使用VIDI数据集，研究者需要将其下载并按照数据集的划分（训练集、验证集和测试集）进行划分，然后选择合适的事件分类模型进行训练和评估。

背景与挑战

背景概述

VIDI数据集的研究背景在于自动检测自然灾害和突发事件，这一领域对于快速响应至关重要。尽管已有许多研究利用静态图像和文本进行事件检测，但利用时间信息的方法却相对有限。主要原因是缺乏一个包含各种事件类型的多样化视频数据集。为了满足这一需求，VIDI数据集应运而生，它包含了4,534个视频片段，对应43个事件类别，每个类别约有100个视频，平均时长为10秒。VIDI的创建填补了该领域的空白，为研究人员提供了探索时间信息在事件分类中作用的可能性。

当前挑战

VIDI数据集面临的主要挑战包括：1) 在事件检测领域，VIDI数据集需要解决的是如何有效利用视频数据中的时间信息来提高事件分类的准确性。2) 在构建过程中，VIDI数据集遇到了多种挑战，如多语言视频搜索中的关键词翻译问题，以及特定事件（如核爆炸）视频样本不足的问题。此外，VIDI数据集允许视频片段具有多个标签，这增加了数据标注的复杂性。尽管VIDI数据集提供了多样化的视频数据，但其分类性能仍面临挑战，如一些事件类别（如山体滑坡）的分类准确率较低，且模型在不同类别之间存在混淆。

常用场景

经典使用场景

VIDI数据集主要用于自动检测自然灾害和突发事件，为快速响应提供工具。该数据集包含了43种不同类型的突发事件，每种事件大约有100个视频片段，平均时长为10秒。这些视频片段是从YouTube上搜索得到的，并使用了多种语言进行搜索，以增加多样性。VIDI数据集可以用于评估最新的最先进的分类方法的性能，并探索视频信息对事件分类的贡献。在VIDI数据集上进行的基准实验表明，最新的方法可以显著提高事件分类的准确性。

衍生相关工作

VIDI数据集的创建衍生了一系列相关工作。例如，研究人员可以使用VIDI数据集来评估和改进现有的最先进的分类方法的性能，探索视频信息对事件分类的贡献。此外，VIDI数据集还可以用于开发新的分类方法，以进一步提高事件分类的准确性。此外，VIDI数据集还可以用于开发新的数据增强技术，以提高模型在事件分类任务上的泛化能力。

数据集最近研究