five

XSpaceCoderX/AD-Rallies

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/XSpaceCoderX/AD-Rallies
下载链接
链接失效反馈
官方服务:
资源简介:
AD-Trajectories数据集是为硕士学位论文《从广播到3D:一种用于网球轨迹和旋转估计的深度学习方法》创建的,由奥格斯堡大学机器学习与计算机视觉系Alexandra Göppert制作。该数据集是一个大规模合成数据集,使用MuJoCo物理引擎生成,旨在通过提供高度准确的物理模型(如马格努斯效应和复杂的球与场地交互)来缩小合成与真实之间的差距。数据集包含约320万次合成的网球对打,从发球开始,最多可包含4次基本击球(如底线击球、截击、高球、短球和扣杀)。所有物理运动学数据,包括3D位置、线速度和角速度(旋转),均以500帧每秒的高分辨率记录,对应时间步长为0.002秒。数据以.npz文件形式存储,每个文件包含七个.npy文件,分别存储空间、时间和相机数据。数据集的总大小为87GB,解压后需要约180GB的磁盘空间。

The AD-Trajectories dataset was created for the Masters thesis "From Broadcast to 3D: A Deep Learning Approach for Tennis Trajectory and Spin Estimation" by Alexandra Göppert at the University Augsburg, Chair of Machine Learning and Computer Vision. The dataset is a large-scale synthetic dataset generated using the MuJoCo physics engine, designed to bridge the synthetic-to-real gap by providing highly accurate physical models of aerodynamic forces, such as the Magnus effect, and complex ball-court interactions. The dataset comprises approximately 3.2 million synthetic tennis rallies, starting with a ball toss and a serve, followed by up to 4 further basic strokes (e.g., groundstroke, volley, lob, short, and smash). All physical kinematics, including 3D positions, linear velocities, and angular velocities (spin), are captured at a high resolution of 500 frames per second (fps), corresponding to a time step of 0.002 seconds. The dataset is stored as .npz files, each containing seven .npy files that store spatial, temporal, and camera data. The total size of the dataset is 87 GB, and extracting it requires approximately 180 GB of disk space.
提供机构:
XSpaceCoderX
搜集汇总
数据集介绍
main_image_url
构建方式
AD-Rallies数据集是一个大规模合成网球回合数据集,由慕尼黑大学利用MuJoCo物理引擎精心构建而成。其构建过程始于模拟20000次抛球,每次抛球与发球组合形成回合主干,随后基于空气动力学与球-场地交互的精确物理模型,为每个主干递归添加最多4次后续击球(如底线击球、截击、挑高球等),生成最多160个分支回合。所有动力学数据——包括三维位置、线速度和角速度——均以500帧/秒的高时间分辨率采样,并存储为NPZ文件。最终数据以.tar压缩包形式发布,包含约320万个回合,文件总大小达87 GB。
特点
该数据集的核心特点在于其高度物理真实性与结构化分层设计。通过精确建模马格努斯效应等空气动力学力,AD-Rallies有效弥合了合成数据与真实世界之间的鸿沟。每个NPZ文件内含七个npy数组,分别记录球体在全局坐标系下的位置和线速度,以及球体局部坐标系下的三维旋转角速度,为三维重建与自旋估计任务提供了丰富且精确的运动学信息。文件名采用“抛球编号_分支编号_终止标记”的层次化命名规则,清晰反映了回合生成的拓扑结构。此外,数据规模达到320万个样本,远超市面现有同类数据集。
使用方法
数据集可通过Hugging Face Hub的hf_hub_download函数高效下载,无需克隆整个仓库。用户只需指定仓库ID(XSpaceCoderX/AD-Rallies)和文件名(data.tar)即可获取压缩包。下载后,使用Python内置的tarfile模块进行解压,该方式兼容Windows、macOS和Linux操作系统。解压前需确保至少有180 GB可用磁盘空间(87 GB压缩文件加100 GB解压后容量)。每个解压出的NPZ文件可直接通过NumPy加载,提取其中存储的位置、速度和旋转数组,适用于分类、回归、三维重建和深度估计等下游任务。
背景与挑战
背景概述
网球运动轨迹分析与参数估计在体育科学和计算机视觉领域具有重要意义,尤其在高精度运动捕捉和三维重建方面。AD-Rallies数据集由德国奥格斯堡大学机器学习与计算机视觉教席的研究生Alexandra Göppert在其硕士论文中创建,旨在通过深度学习实现从广播视频到三维空间的网球轨迹与旋转估计。该数据集于近期发布,依托MuJoCo物理引擎生成了约320万条合成网球对打序列,以高保真物理模型精确模拟马格努斯效应等空气动力学力以及复杂的球-场地交互作用。其核心研究问题在于弥合合成数据与现实世界数据之间的鸿沟,为网球轨迹与旋转估计提供大规模、高精度的训练基准。该数据集凭借其精细的运动学记录(500帧/秒的采样率覆盖位置、线速度和角速度),为相关领域的研究树立了新的标杆,对推动运动分析、增强现实及体育广播技术革新具有深远影响。
当前挑战
AD-Rallies数据集面临的挑战主要集中在两个方面。在领域问题层面,网球轨迹与旋转估计的核心难题在于从二维广播视频中精确恢复三维运动参数,这要求模型能够有效处理遮挡、光照变化、低分辨率以及高速旋转带来的非线性效应。传统方法多依赖手工特征与物理约束,而数据驱动的深度学习范式则亟需大规模、标注精准的训练数据来学习鲁棒的时空表示,但真实比赛数据的采集代价高昂且难以穷举各种复杂场景。在数据集构建过程中,挑战在于如何确保合成数据的物理真实性以缩小与现实世界的差距,包括精确模拟空气动力学、不同场地表面的摩擦特性以及多达320万条对打序列的多样化生成;此外,数据存储与分发也面临工程难题,87GB的压缩归档与180GB的解压空间需求对用户的计算资源提出了较高门槛,而基于tar和npz的格式虽便于科学计算,但随机访问与批量加载的效率仍需优化。
常用场景
经典使用场景
在体育科学与计算机视觉交叉领域,AD-Rallies数据集为网球轨迹分析与三维重建提供了前所未有的数据支撑。该数据集利用MuJoCo物理引擎生成约320万条合成网球回合轨迹,以500帧/秒的高频采样捕获了球体的三维位置、线速度和角速度(旋转)等关键物理参数。研究者可借此开展基于深度学习的球体运动预测、轨迹回归与自旋估计等经典任务,通过模拟真实的马格努斯效应和球-场地交互,构建高保真的运动学模型,为后续的3D场景理解与动态物体追踪奠定坚实基础。
实际应用
该数据集在实际应用中具有广泛前景,尤其在体育转播与智能训练领域。基于其中的轨迹与旋转数据,可以开发实时球体三维追踪系统,辅助裁判判断落点与出界争议;也能为AI教练提供运动分析工具,通过解析球路旋转模式为运动员提供战术反馈。此外,数据集生成的精确物理参数可迁移至虚拟现实(VR)与增强现实(AR)体育模拟器,营造高度真实的网球对战场景,提升用户沉浸感。
衍生相关工作
自AD-Rallies发布以来,围绕它已衍生出一系列富有影响力的研究工作。经典工作包括基于残差网络的轨迹回归模型,利用时序卷积从视频帧中直接预测球体三维位置与旋转向量;同时有学者提出物理知识蒸馏框架,将数据集中的精确动力学参数作为教师信号,指导轻量级网络在真实视频上进行自旋估计。这些工作不仅验证了数据集在弥补合成-真实差距方面的有效性,还推动了端到端体育动作解析与物理仿真结合的技术路线发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作