BoxMAC

Name: BoxMAC
Creator: 印度理工学院马德拉斯分校
Published: 2024-12-24 14:20:01
License: 暂无描述

arXiv2024-12-24 更新2024-12-26 收录

下载链接：

http://arxiv.org/abs/2412.18204v1

下载链接

链接失效反馈

官方服务：

资源简介：

BoxMAC是一个专注于多标签动作分类的拳击数据集，由印度理工学院马德拉斯分校的研究团队创建。该数据集包含15名职业拳击手的比赛数据，涵盖了13种不同的拳击动作，如刺拳、直拳、勾拳等。数据集由超过60,000帧图像组成，每帧图像都经过精心标注，标注工作在拳击教练的指导下完成。数据集的创建过程包括使用4台PTZ摄像机从不同角度捕捉拳击比赛，并通过人工标注捕捉每帧中的多个动作。BoxMAC数据集的应用领域主要集中在拳击动作的自动识别和分类，旨在为教练和研究人员提供有价值的统计数据和反馈，以优化训练策略和提升运动员表现。

BoxMAC is a boxing dataset focused on multi-label action classification, created by a research team from the Indian Institute of Technology Madras. This dataset contains match data from 15 professional boxers, covering 13 distinct boxing actions such as jab, straight punch, hook and so on. It consists of over 60,000 frames of images, with each frame carefully annotated under the guidance of boxing coaches. The dataset was developed by capturing boxing matches from multiple angles using 4 PTZ cameras, and multiple actions in each frame were manually annotated. The main application scenarios of the BoxMAC dataset focus on automatic recognition and classification of boxing actions, aiming to provide valuable statistical data and feedback for coaches and researchers to optimize training strategies and improve athletes' performance.

提供机构：

印度理工学院马德拉斯分校

创建时间：

2024-12-24

搜集汇总

数据集介绍

构建方式

BoxMAC数据集的构建采用了四台PTZ摄像机进行全方位拍摄，确保从不同角度捕捉拳击活动。数据集包含15名职业拳击手的比赛视频，每段视频平均时长为4分钟，帧率为25帧/秒。通过提取视频帧，生成了超过60,000张图像，每张图像均经过人工标注，标注过程在专业拳击教练的指导下进行，确保标注的准确性和可靠性。此外，数据集还生成了2314个视频片段，这些片段通过将连续帧中相同动作的帧序列进行分组生成，每个片段包含8至40帧。

特点

BoxMAC数据集的特点在于其多样性和真实性。数据集涵盖了13种不同的拳击动作，包括六种主要拳击动作（如刺拳、直拳、前勾拳等）以及七种其他拳击动作（如站姿、闪避、格挡等）。每帧图像可能包含多个动作标签，反映了拳击比赛中动作的复杂性和多样性。数据集的标注采用了多标签分类方法，确保每个帧中的多个动作都能被准确记录。此外，数据集还提供了视频片段，进一步丰富了数据的表现形式，使其适用于图像和视频分类任务。

使用方法

BoxMAC数据集的使用方法主要围绕多标签动作分类任务展开。在图像分类任务中，研究者可以使用深度学习模型（如VGG16、VGG19、ResNet50和ViT）对图像中的拳击动作进行分类。对于视频分类任务，ConvLSTM模型被用于处理连续帧中的时空特征，以识别视频片段中的动作。数据集被划分为训练集和测试集，训练集包含42,000张图像和1,584个视频片段，测试集包含18,000张图像和730个视频片段。通过训练和测试不同的深度学习模型，研究者可以评估模型在多标签动作分类任务中的性能，并进一步优化模型以提高分类准确率。

背景与挑战

背景概述

BoxMAC数据集由印度理工学院马德拉斯分校的Shashikanta Sahoo等人于2024年提出，旨在为拳击运动中的多标签动作分类提供支持。该数据集包含15名职业拳击手的比赛视频，涵盖13种不同的拳击动作，共计超过60,000帧图像。每帧图像均经过精细标注，捕捉了拳击手在同一时间点可能执行的多种动作。BoxMAC的创建填补了拳击视频分析领域的空白，特别是在多标签动作分类方面，为教练和研究人员提供了宝贵的资源，以优化训练策略和提升运动员表现。该数据集不仅推动了拳击运动的技术发展，还为计算机视觉领域的研究提供了新的挑战和机遇。

当前挑战

BoxMAC数据集在构建和应用过程中面临多重挑战。首先，拳击动作的细微差异使得准确分类变得复杂，特别是当两名拳击手在同一帧中执行不同动作时，多标签分类的难度显著增加。其次，拳击手的姿势（如正架或反架）以及出拳方向（身体或头部）进一步增加了动作识别的复杂性。在数据构建过程中，如何确保标注的准确性和一致性也是一个重要挑战，尤其是在动态比赛中，动作的快速变化和遮挡问题使得标注工作尤为困难。此外，BoxMAC需要处理大量视频帧，如何高效地提取和分类时空特征也是技术上的难点。这些挑战不仅考验了数据集的构建质量，也对后续的模型设计和算法优化提出了更高的要求。

常用场景

经典使用场景

BoxMAC数据集在拳击动作分类研究中具有广泛的应用，尤其是在多标签动作分类任务中。该数据集通过捕捉15名职业拳击手在拳击场上的13种不同动作，提供了丰富的图像和视频数据。研究人员可以利用这些数据训练深度学习模型，以识别拳击手在同一时间点执行的不同动作。BoxMAC的经典使用场景包括拳击动作的自动识别、拳击手技术分析以及比赛策略的优化。

实际应用

在实际应用中，BoxMAC数据集为拳击教练和运动员提供了宝贵的工具，用于技术分析和训练优化。通过自动识别拳击手的动作，教练可以更准确地评估运动员的表现，并制定个性化的训练计划。此外，BoxMAC还可以用于拳击比赛的实时分析，帮助裁判和观众更好地理解比赛中的技术细节。该数据集的应用不仅提升了拳击训练的科学性，还为拳击运动的普及和推广提供了技术支持。

衍生相关工作

BoxMAC数据集的发布催生了一系列相关研究，尤其是在多标签动作分类和拳击动作识别领域。基于BoxMAC，研究人员提出了多种深度学习模型，如VGG16、VGG19、ResNet50和ConvLSTM，用于提升拳击动作识别的准确性。此外，BoxMAC还激发了关于拳击动作特征提取和时空数据分析的研究，推动了计算机视觉技术在体育分析中的应用。这些衍生工作不仅丰富了拳击动作识别的理论框架，还为其他体育项目的动作分析提供了借鉴。

以上内容由遇见数据集搜集并总结生成

社区讨论

#经验分享

ArXiv论文作者在Figshare上也放了数据集: https://figshare.com/collections/FUMPE/4107803/1

5,000+

优质数据集

54 个

任务类型

进入经典数据集