five

P2ANet|乒乓球数据集|视频动作检测数据集

收藏
arXiv2024-03-26 更新2024-08-06 收录
乒乓球
视频动作检测
下载链接:
http://arxiv.org/abs/2207.12730v2
下载链接
链接失效反馈
资源简介:
P2ANet是一个大规模的乒乓球比赛视频动作检测基准数据集,由百度公司创建。该数据集包含2721个从世界乒乓球锦标赛和奥运会广播视频中收集的视频片段,总时长272小时。数据集通过与乒乓球专业人士和裁判合作,使用专门设计的标注工具箱进行精细动作标签(共14类)的标注。P2ANet数据集的特点是动作密集且快速移动,动作长度从0.3秒到3秒不等,超过90%的动作持续时间不到1秒,每10秒约有15个动作,密度极高。该数据集主要用于视频动作识别和定位研究,旨在解决快速移动和密集动作场景下的动作检测问题。
提供机构:
百度公司
创建时间:
2022-07-26
AI搜集汇总
数据集介绍
main_image_url
构建方式
P2ANet数据集的构建过程主要分为数据收集、视频分割、动作标注和校准四个步骤。首先,研究团队从国际乒乓球联合会(ITTF)和中国乒乓球博物馆获取了2017年至2021年间的顶级赛事广播视频,包括奥运会、世界杯和世界锦标赛等。这些视频被分割为6分钟的片段,以确保数据的完整性和高分辨率。随后,通过与乒乓球专业运动员和裁判的合作,使用专门设计的标注工具对每个乒乓球动作进行细粒度标注,共分为14类动作。最后,通过专业校准,确保标注的准确性,最终形成了包含2,721个视频片段、总计272小时的数据集。
特点
P2ANet数据集的特点主要体现在其高密度和快速动作的特性上。数据集中的动作持续时间通常在0.3秒至3秒之间,超过90%的动作持续时间不到1秒,动作密度极高,平均每10秒内约有15个动作。此外,P2ANet是目前最大的乒乓球动作检测数据集,涵盖了多种复杂的动作类别,且所有标注均由专业运动员确认,确保了数据的高质量。这些特点使得P2ANet成为研究密集动作检测的理想基准。
使用方法
P2ANet数据集主要用于动作识别和动作定位任务。在动作识别任务中,研究者可以使用该数据集训练和评估各种视频分类模型,如TSN、TSM、SlowFast等。在动作定位任务中,P2ANet可用于生成动作提案并评估其时间边界精度,常用的模型包括BSN、BMN和TCANet等。此外,P2ANet还支持动作检测任务,结合动作识别和定位模型,研究者可以进一步探索视频中的动作序列。数据集的高密度和快速动作特性为模型优化提供了挑战,同时也为未来的研究提供了丰富的实验场景。
背景与挑战
背景概述
P2ANet数据集由百度公司于2018年发布,旨在为乒乓球比赛视频中的密集动作检测提供一个大规模基准。该数据集由2,721个从世界乒乓球锦标赛和奥运会等顶级赛事中收集的广播视频片段组成,涵盖了14类细粒度动作标签。P2ANet的创建团队与乒乓球专业人士和裁判合作,使用专门设计的标注工具对每个动作进行精确标注,并提出了动作定位和动作识别两大任务。该数据集在视频分析领域具有重要影响力,尤其是在快速移动和密集动作检测方面,为相关研究提供了宝贵的资源。
当前挑战
P2ANet数据集面临的挑战主要体现在两个方面。首先,乒乓球动作具有快速移动和密集的特点,动作持续时间通常在0.3秒至3秒之间,且90%以上的动作持续时间不足1秒,这对动作的精确识别和定位提出了极高的要求。其次,数据集的构建过程中,由于动作的快速性和复杂性,标注工作极为困难,尤其是在处理欺骗性动作(如不同旋转的发球)时,专业裁判的参与成为确保标注质量的关键。此外,广播视频的帧率仅为25 FPS,进一步增加了动作检测的难度,现有模型在动作定位和识别任务上的表现仍有较大提升空间。
常用场景
经典使用场景
P2ANet数据集主要用于乒乓球比赛视频中的密集动作检测,特别是在快速移动的乒乓球动作识别和定位任务中。该数据集通过提供大量经过精细标注的乒乓球比赛视频片段,支持研究人员开发和评估动作识别与定位模型。P2ANet的独特之处在于其动作密度高且动作持续时间短,这为研究快速动作检测提供了极具挑战性的基准。
衍生相关工作
P2ANet的发布催生了一系列相关研究工作,特别是在密集动作检测和快速动作识别领域。基于P2ANet,研究人员提出了多种改进的动作识别和定位模型,如结合时间卷积网络和边界匹配网络的混合模型。此外,P2ANet还激发了针对低帧率视频中快速动作检测的新方法研究,推动了视频分析技术的进一步发展。
数据集最近研究
最新研究方向
近年来,P2ANet数据集在视频动作检测领域引起了广泛关注,特别是在乒乓球比赛视频中的密集动作检测方面。随着深度学习技术的快速发展,视频分析任务如动作识别和定位已成为研究热点。P2ANet作为一个大规模、高质量的数据集,专注于乒乓球比赛中的快速移动和密集动作,为研究者提供了一个极具挑战性的基准。当前的研究方向主要集中在如何提升模型对快速动作的识别和定位能力,尤其是在低帧率广播视频中。尽管已有多种动作识别和定位模型(如TSM、Slowfast、BMN等)在P2ANet上进行了评估,但其表现仍不尽如人意,尤其是在动作定位任务中,AR-AN曲线下的面积仅为48%。这表明P2ANet在密集动作检测方面仍存在较大的研究空间。未来的研究可能会集中在改进模型的时空建模能力、引入更高效的视频特征提取方法,以及探索自监督学习等新兴技术,以应对P2ANet带来的独特挑战。
相关研究论文
  • 1
    P2ANet: A Dataset and Benchmark for Dense Action Detection from Table Tennis Match Broadcasting Videos百度公司 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2023)

地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2023年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2023)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心 收录