jherng/xd-violence

Name: jherng/xd-violence
Creator: jherng
Published: 2023-12-31 05:25:08
License: 暂无描述

Hugging Face2023-12-31 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/jherng/xd-violence

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个配置，主要用于视频内容的分类和标注。每个配置包含视频的ID、路径、二进制目标（非暴力或暴力）、多标签目标（如正常、打斗、射击、骚乱、虐待、车祸、爆炸等）以及帧注释（开始和结束时间）。数据集分为训练集和测试集，适用于视频内容分析和暴力检测等任务。

提供机构：

jherng

原始信息汇总

数据集概述

数据集配置

配置名称：video

特征信息：
- id：数据类型为字符串。
- path：数据类型为字符串。
- binary_target：分类标签，包括“Non-violence”和“Violence”。
- multilabel_target：多标签分类，包括“Normal”、“Fighting”、“Shooting”、“Riot”、“Abuse”、“Car accident”和“Explosion”。
- frame_annotations：序列特征，包括“start”和“end”，数据类型为整数32位。
数据分割：
- train：字节数为782565，样本数为3950。
- test：字节数为169505，样本数为800。
下载大小：85510639707字节。
数据集大小：952070字节。

配置名称：i3d_rgb

特征信息：
- id：数据类型为字符串。
- feature：二维数组，形状为[2048]，数据类型为浮点32位。
- binary_target：分类标签，包括“Non-violence”和“Violence”。
- multilabel_target：多标签分类，包括“Normal”、“Fighting”、“Shooting”、“Riot”、“Abuse”、“Car accident”和“Explosion”。
- frame_annotations：序列特征，包括“start”和“end”，数据类型为整数32位。
数据分割：
- train：字节数为10535081525，样本数为19750。
- test：字节数为1512537525，样本数为4000。
下载大小：12040668091字节。
数据集大小：12047619050字节。

配置名称：swin_rgb

特征信息：
- id：数据类型为字符串。
- feature：二维数组，形状为[768]，数据类型为浮点32位。
- binary_target：分类标签，包括“Non-violence”和“Violence”。
- multilabel_target：多标签分类，包括“Normal”、“Fighting”、“Shooting”、“Riot”、“Abuse”、“Car accident”和“Explosion”。
- frame_annotations：序列特征，包括“start”和“end”，数据类型为整数32位。
数据分割：
- train：字节数为3954857525，样本数为19750。
- test：字节数为567897525，样本数为4000。
下载大小：4515804091字节。
数据集大小：4522755050字节。

配置名称：c3d_rgb

特征信息：
- id：数据类型为字符串。
- feature：二维数组，形状为[4096]，数据类型为浮点32位。
- binary_target：分类标签，包括“Non-violence”和“Violence”。
- multilabel_target：多标签分类，包括“Normal”、“Fighting”、“Shooting”、“Riot”、“Abuse”、“Car accident”和“Explosion”。
- frame_annotations：序列特征，包括“start”和“end”，数据类型为整数32位。
数据分割：
- train：字节数为41963220205，样本数为19750。
- test：字节数为6014361825，样本数为4000。
下载大小：47964799931字节。
数据集大小：47977582030字节。

搜集汇总

数据集介绍

构建方式

在构建jherng/xd-violence数据集时，研究者们精心设计了多层次的标注体系，以确保数据集的多样性和准确性。首先，数据集包含了视频和多种特征提取方法（如I3D、Swin和C3D）的配置，每种配置下均设有训练和测试集。视频配置中，每个视频样本被赋予唯一的ID，并标注了二元目标（暴力与非暴力）和多标签目标（如正常、斗殴、射击等）。此外，每个视频的帧级标注提供了时间段的起始和结束点，以便于细粒度的分析。

特点

jherng/xd-violence数据集的显著特点在于其多模态和多层次的标注结构。数据集不仅涵盖了视频数据，还包含了通过不同深度学习模型提取的特征，如I3D、Swin和C3D，这为研究者提供了丰富的分析维度。此外，数据集的二元和多标签目标标注，以及帧级的时间段标注，使得该数据集在暴力行为检测和分类任务中具有极高的应用价值。

使用方法

使用jherng/xd-violence数据集时，研究者可以根据具体需求选择不同的配置（如视频、I3D、Swin或C3D）进行数据加载和处理。数据集提供了详细的标注信息，包括二元目标和多标签目标，以及帧级的时间段标注，这些信息可以用于训练和评估暴力行为检测模型。通过HuggingFace的datasets库，用户可以方便地加载和预处理数据，进行模型训练和测试。

背景与挑战

背景概述

在视频内容分析领域，识别和分类暴力行为是一个重要的研究课题。jherng/xd-violence数据集由主要研究人员或机构创建，旨在为机器学习模型提供一个标准化的数据集，以识别和分类视频中的暴力行为。该数据集包含多种配置，如video、i3d_rgb、swin_rgb和c3d_rgb，每种配置都提供了丰富的特征和标签，包括二元目标（暴力与非暴力）和多标签目标（如正常、斗殴、射击等）。数据集的创建时间为近期，其核心研究问题是如何通过机器学习技术准确识别和分类视频中的暴力行为，这对于公共安全、媒体监管等领域具有重要意义。

当前挑战

jherng/xd-violence数据集在构建过程中面临多个挑战。首先，视频内容的多样性和复杂性使得暴力行为的定义和识别变得困难，尤其是在多标签分类中，不同类型的暴力行为需要精确区分。其次，数据集的规模和多样性要求高效的特征提取和处理技术，以确保模型训练的有效性。此外，数据集的标注工作需要高度专业性和一致性，以避免标签噪声对模型性能的影响。最后，数据集的隐私和伦理问题也是不可忽视的挑战，尤其是在处理涉及暴力行为的视频内容时，需要严格遵守相关法律法规和伦理标准。

常用场景

经典使用场景

在视频内容分析领域，jherng/xd-violence数据集被广泛用于暴力行为的检测与分类。该数据集通过提供视频片段及其对应的二元和多标签目标，使得研究人员能够训练和评估模型在识别不同类型的暴力行为，如斗殴、射击、骚乱等。这种多层次的分类任务不仅提升了模型的复杂性处理能力，也为实际应用中的准确性提供了坚实基础。

实际应用

在实际应用中，jherng/xd-violence数据集被用于开发和优化视频监控系统，以实时检测和预警潜在的暴力事件。例如，在公共场所、学校和监狱等高风险区域，该数据集训练的模型能够有效识别并分类各种暴力行为，从而及时采取干预措施，保障公共安全。此外，该数据集还支持在社交媒体平台上的内容审核，自动检测和过滤含有暴力内容的视频，维护网络环境的和谐与安全。

衍生相关工作

基于jherng/xd-violence数据集，研究者们开展了多项相关工作，推动了视频内容分析技术的发展。例如，有研究利用该数据集开发了基于深度学习的暴力行为检测模型，显著提升了检测的准确率和实时性。此外，还有研究通过结合多模态数据，如音频和视频，进一步增强了模型的识别能力。这些衍生工作不仅丰富了视频内容分析的理论体系，也为实际应用提供了更多可能性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集