Calisthenics Skills Temporal Video Segmentation Dataset

Name: Calisthenics Skills Temporal Video Segmentation Dataset
Creator: 卡塔尼亚大学数学与计算机科学系
Published: 2025-07-16 21:55:27
License: 暂无描述

arXiv2025-07-16 更新2025-07-18 收录

下载链接：

https://github.com/fpv-iplab/calisthenics-skills-segmentation

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由卡塔尼亚大学数学与计算机科学系的研究人员创建，包含839个视频，记录了运动员执行9种静态体操技能的情况。每个视频都经过人工标注，确定了每个技能的开始和结束时间。数据集旨在帮助运动员在训练中识别和量化技能的持续时间，并为裁判在比赛中提供辅助。数据集的视频来自不同的来源，包括社交网络和专门录制的视频，以确保视频的真实性和自然性。数据集还包括使用OpenPose技术提取的运动员关节坐标。数据集分为训练集和测试集，其中训练集包含80%的视频，测试集包含20%的视频。

This dataset was created by researchers from the Department of Mathematics and Computer Science, University of Catania. It consists of 839 videos capturing athletes performing 9 types of static gymnastic skills. Each video has been manually annotated to determine the start and end timestamps of each skill. The dataset aims to assist athletes in identifying and quantifying the duration of their skills during training, and provide support for referees during competitions. The videos are sourced from various channels including social networks and specially recorded footage to ensure the authenticity and naturalness of the content. The dataset also includes joint coordinates of athletes extracted using OpenPose technology. It is split into training and test sets, with the training set accounting for 80% of the total videos and the test set making up the remaining 20%.

提供机构：

卡塔尼亚大学数学与计算机科学系

创建时间：

2025-07-16

原始信息汇总

Calisthenics Skills Temporal Video Segmentation 数据集概述

数据集基本信息

数据集名称: Calisthenics Skills Temporal Video Segmentation
相关论文:
Finocchiaro, A.; Farinella, G. and Furnari, A. (2024). Calisthenics Skills Temporal Video Segmentation. In Proceedings of the 19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications - Volume 2: VISAPP, ISBN 978-989-758-679-8, ISSN 2184-4321, pages 182-190.

数据集内容

数据目录: /data/keypoints_dataset
数据类型: 关键点数据集

使用要求

依赖库: 安装requirements.txt中的库
额外工具: 需要安装OpenPose

搜集汇总

数据集介绍

构建方式

Calisthenics Skills Temporal Video Segmentation Dataset的构建基于对839个视频的收集与标注，这些视频涵盖了9种流行的静态健美操技能。视频来源包括社交媒体和专门录制的素材，以确保数据的多样性和真实性。每个视频经过手动标注，标明了技能执行的开始和结束时间。此外，使用OpenPose工具提取了运动员的关节空间坐标，进一步丰富了数据集的信息维度。数据集的构建过程注重细节，包括视频的分辨率统一为960x540像素，帧率为24帧每秒，以确保数据的一致性。

特点

该数据集的特点在于其专注于静态健美操技能的时间分割，填补了该领域的研究空白。数据集包含9种不同难度的技能，每种技能的视频数量和持续时间均有详细统计。视频背景多样，既有室内健身房，也有户外公园等场景，增强了数据集的实用性。通过OpenPose提取的关节坐标数据为研究者提供了丰富的空间信息，便于进行动作识别和时间分割的深入研究。数据集的标注精细，每个视频的技能执行时间精确到帧，为算法评估提供了可靠的标准。

使用方法

该数据集的使用方法主要包括两个步骤：基于帧的多类分类和时间分割模块的优化。研究者可以利用提取的关节坐标数据，通过多层感知机（MLP）进行每帧的分类，识别技能或背景段。随后，采用启发式或概率方法对分类结果进行时间分割，以生成连贯的技能时间段。数据集已公开提供，研究者可直接下载并使用其进行算法开发和性能评估。数据集的训练集和测试集划分比例为80%和20%，便于进行模型训练和验证。

背景与挑战

背景概述

Calisthenics Skills Temporal Video Segmentation Dataset由卡塔尼亚大学的研究团队于2025年创建，旨在填补健美操技能视频分析领域的研究空白。该数据集聚焦于静态健美操技能的时序分割问题，包含839个标注视频，涵盖9种常见技能。通过OpenPose提取运动员关节坐标数据，该研究为计算机视觉在健美操训练和比赛评判中的应用提供了首个基准数据集，推动了基于姿态分析的体育动作识别研究发展。

当前挑战

该数据集面临两个层面的挑战：在领域问题层面，静态技能持续时间估计需要精确识别动作起始边界，而倒立类动作因肢体遮挡导致姿态估计困难；在构建过程层面，多背景视频采集需确保主体显著性，滑动窗口算法需平衡分割精度与计算效率，且类别不平衡问题影响分类器性能。这些挑战反映了体育视频分析中时序分割任务的共性难题。

常用场景

经典使用场景

Calisthenics Skills Temporal Video Segmentation Dataset 主要用于静态和动态健美操技能的时间视频分割研究。该数据集通过标注运动员执行特定技能的起始和结束时间，为计算机视觉领域提供了丰富的训练和测试材料。其经典应用场景包括基于姿态识别的技能持续时间估计，以及通过视频分析辅助运动员训练和比赛评分。

实际应用

在实际应用中，该数据集可用于开发自动化工具，帮助运动员在训练中精确测量技能持续时间，优化训练效果。同时，它还可用于比赛评分系统，为裁判提供客观的技能执行时间数据，减少人为评分误差，提升比赛公平性。

衍生相关工作

该数据集衍生了多项经典工作，包括基于多层感知机（MLP）的帧分类方法和启发式与概率时间分割算法的比较研究。这些工作不仅验证了数据集的实用性，还为后续研究提供了基础框架，推动了健美操视频分析领域的发展。

以上内容由遇见数据集搜集并总结生成