five

P2ANet

收藏
arXiv2024-03-26 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2207.12730v2
下载链接
链接失效反馈
官方服务:
资源简介:
P2ANet是一个大规模的乒乓球比赛视频动作检测基准数据集,由百度公司创建。该数据集包含2721个从世界乒乓球锦标赛和奥运会广播视频中收集的视频片段,总时长272小时。数据集通过与乒乓球专业人士和裁判合作,使用专门设计的标注工具箱进行精细动作标签(共14类)的标注。P2ANet数据集的特点是动作密集且快速移动,动作长度从0.3秒到3秒不等,超过90%的动作持续时间不到1秒,每10秒约有15个动作,密度极高。该数据集主要用于视频动作识别和定位研究,旨在解决快速移动和密集动作场景下的动作检测问题。

P2ANet is a large-scale benchmark dataset for table tennis match video action detection, created by Baidu. This dataset contains 2,721 video clips collected from the broadcast videos of World Table Tennis Championships and Olympic Games, with a total duration of 272 hours. The dataset was annotated with fine-grained action labels (14 categories in total) using a specially designed annotation toolbox, in collaboration with table tennis professionals and referees. Notably, P2ANet features dense and fast-paced actions, with action durations ranging from 0.3 seconds to 3 seconds. Over 90% of the actions last less than 1 second, and there are approximately 15 actions per 10 seconds, leading to an extremely high action density. This dataset is primarily used for research on video action recognition and localization, aiming to solve the action detection problems in fast-moving and dense action scenarios.
提供机构:
百度公司
创建时间:
2022-07-26
搜集汇总
数据集介绍
main_image_url
构建方式
P2ANet数据集的构建过程主要分为数据收集、视频分割、动作标注和校准四个步骤。首先,研究团队从国际乒乓球联合会(ITTF)和中国乒乓球博物馆获取了2017年至2021年间的顶级赛事广播视频,包括奥运会、世界杯和世界锦标赛等。这些视频被分割为6分钟的片段,以确保数据的完整性和高分辨率。随后,通过与乒乓球专业运动员和裁判的合作,使用专门设计的标注工具对每个乒乓球动作进行细粒度标注,共分为14类动作。最后,通过专业校准,确保标注的准确性,最终形成了包含2,721个视频片段、总计272小时的数据集。
特点
P2ANet数据集的特点主要体现在其高密度和快速动作的特性上。数据集中的动作持续时间通常在0.3秒至3秒之间,超过90%的动作持续时间不到1秒,动作密度极高,平均每10秒内约有15个动作。此外,P2ANet是目前最大的乒乓球动作检测数据集,涵盖了多种复杂的动作类别,且所有标注均由专业运动员确认,确保了数据的高质量。这些特点使得P2ANet成为研究密集动作检测的理想基准。
使用方法
P2ANet数据集主要用于动作识别和动作定位任务。在动作识别任务中,研究者可以使用该数据集训练和评估各种视频分类模型,如TSN、TSM、SlowFast等。在动作定位任务中,P2ANet可用于生成动作提案并评估其时间边界精度,常用的模型包括BSN、BMN和TCANet等。此外,P2ANet还支持动作检测任务,结合动作识别和定位模型,研究者可以进一步探索视频中的动作序列。数据集的高密度和快速动作特性为模型优化提供了挑战,同时也为未来的研究提供了丰富的实验场景。
背景与挑战
背景概述
P2ANet数据集由百度公司于2018年发布,旨在为乒乓球比赛视频中的密集动作检测提供一个大规模基准。该数据集由2,721个从世界乒乓球锦标赛和奥运会等顶级赛事中收集的广播视频片段组成,涵盖了14类细粒度动作标签。P2ANet的创建团队与乒乓球专业人士和裁判合作,使用专门设计的标注工具对每个动作进行精确标注,并提出了动作定位和动作识别两大任务。该数据集在视频分析领域具有重要影响力,尤其是在快速移动和密集动作检测方面,为相关研究提供了宝贵的资源。
当前挑战
P2ANet数据集面临的挑战主要体现在两个方面。首先,乒乓球动作具有快速移动和密集的特点,动作持续时间通常在0.3秒至3秒之间,且90%以上的动作持续时间不足1秒,这对动作的精确识别和定位提出了极高的要求。其次,数据集的构建过程中,由于动作的快速性和复杂性,标注工作极为困难,尤其是在处理欺骗性动作(如不同旋转的发球)时,专业裁判的参与成为确保标注质量的关键。此外,广播视频的帧率仅为25 FPS,进一步增加了动作检测的难度,现有模型在动作定位和识别任务上的表现仍有较大提升空间。
常用场景
经典使用场景
P2ANet数据集主要用于乒乓球比赛视频中的密集动作检测,特别是在快速移动的乒乓球动作识别和定位任务中。该数据集通过提供大量经过精细标注的乒乓球比赛视频片段,支持研究人员开发和评估动作识别与定位模型。P2ANet的独特之处在于其动作密度高且动作持续时间短,这为研究快速动作检测提供了极具挑战性的基准。
衍生相关工作
P2ANet的发布催生了一系列相关研究工作,特别是在密集动作检测和快速动作识别领域。基于P2ANet,研究人员提出了多种改进的动作识别和定位模型,如结合时间卷积网络和边界匹配网络的混合模型。此外,P2ANet还激发了针对低帧率视频中快速动作检测的新方法研究,推动了视频分析技术的进一步发展。
数据集最近研究
最新研究方向
近年来,P2ANet数据集在视频动作检测领域引起了广泛关注,特别是在乒乓球比赛视频中的密集动作检测方面。随着深度学习技术的快速发展,视频分析任务如动作识别和定位已成为研究热点。P2ANet作为一个大规模、高质量的数据集,专注于乒乓球比赛中的快速移动和密集动作,为研究者提供了一个极具挑战性的基准。当前的研究方向主要集中在如何提升模型对快速动作的识别和定位能力,尤其是在低帧率广播视频中。尽管已有多种动作识别和定位模型(如TSM、Slowfast、BMN等)在P2ANet上进行了评估,但其表现仍不尽如人意,尤其是在动作定位任务中,AR-AN曲线下的面积仅为48%。这表明P2ANet在密集动作检测方面仍存在较大的研究空间。未来的研究可能会集中在改进模型的时空建模能力、引入更高效的视频特征提取方法,以及探索自监督学习等新兴技术,以应对P2ANet带来的独特挑战。
相关研究论文
  • 1
    P2ANet: A Dataset and Benchmark for Dense Action Detection from Table Tennis Match Broadcasting Videos百度公司 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作