BASKET
收藏arXiv2025-03-27 更新2025-03-28 收录
下载链接:
https://github.com/yulupan00/BASKET
下载链接
链接失效反馈官方服务:
资源简介:
BASKET是一个大规模的篮球视频数据集,由北卡罗来纳大学教堂山分校创建,包含4477小时的视频,捕捉了来自全球的32232名篮球运动员。数据集涵盖了20种细粒度的篮球技能,旨在通过深入的视频分析捕捉球员技能的细微差别。该数据集具有前所未有的多样性,包括性别、年龄、技能水平、地理位置等方面的差异。数据集可用于细粒度技能估计任务,为视频识别模型提供了挑战。
BASKET is a large-scale basketball video dataset created by the University of North Carolina at Chapel Hill. It contains 4,477 hours of footage featuring 32,232 basketball players from across the globe. The dataset covers 20 fine-grained basketball skills, aiming to capture the subtle nuances of player skills through in-depth video analysis. Boasting unprecedented diversity, it encompasses variations in gender, age, skill level, geographic location, and other aspects. This dataset can be used for fine-grained skill estimation tasks, posing challenges for video recognition models.
提供机构:
北卡罗来纳大学教堂山分校
创建时间:
2025-03-27
原始信息汇总
BASKET🏀: 大规模细粒度技能评估视频数据集
数据集概述
- 名称: BASKET (Basketball Skill Estimation)
- 研究团队: Yulu Pan, Ce Zhang, Gedas Bertasius (UNC Chapel Hill)
- 发表会议: CVPR 2025
- 论文链接: https://arxiv.org/abs/2503.20781
- 项目主页: https://sites.google.com/cs.unc.edu/basket
- 数据申请: https://docs.google.com/forms/d/e/1FAIpQLSd_NXfijBL4nIn0aXDNni3VCPoYGUM5l8w55uOtD11qp_g5iQ/viewform?usp=dialog
核心特点
-
大规模数据:
- 4,477小时篮球视频
- 包含32,232名全球篮球运动员
-
广泛多样性:
- 覆盖21个职业和业余篮球联赛
- 包含7,000+女性运动员
- 标注20项篮球技能等级
-
应用价值:
- 支持高级视频模型开发
- 适用于公平球探评估和个性化球员发展等场景
数据详情
数据结构
BASKET/ ├── 赛季文件夹(如18-19)/ │ ├── 联赛文件夹(如NBA)/ │ │ ├── 视频文件(如1_18_19.mp4) │ │ └── ... │ └── ... └── ...
标注结构
- 标注文件: train.csv/val.csv/test.csv
- 标注内容:
- 视频路径
- 20项技能评分(0-4分,4分为优秀)
- 特殊说明:防守一致性技能评分反向(0表示优秀防守)
获取方式
- 填写Google表单申请访问权限
- 同意数据使用条款
- 获取下载链接和使用指南
技术细节
- 训练硬件: 8×NVIDIA RTX A6000 GPU
- 模型检查点: https://www.dropbox.com/scl/fo/owwl5gpfj34rgf16iqp2g/ABfiu4ld9wCwBrmUU6k_ROg?rlkey=zayb4qpgom7ig74hx8hqy3t64&st=ti26uf75&dl=0
搜集汇总
数据集介绍

构建方式
BASKET数据集的构建采用了系统化的多阶段流程。研究团队首先从全球篮球比赛回放档案中收集了约66,000场比赛视频,这些视频均包含专家标注的时间戳球员事件记录。随后,通过精心筛选21个篮球联盟的32,232名球员,采用随机采样策略从每位球员的比赛中提取50个事件片段,每个片段平均10秒,最终组合生成长约9分钟的高光视频。所有视频统一处理为704x400分辨率和30帧率。技能标注则由篮球专家完成,对20项细粒度篮球技能进行五级评分,并确保评分在同一联赛和赛季内具有可比性。
特点
BASKET数据集以其前所未有的规模和多样性著称,包含4,477小时视频和32,232名球员数据,覆盖全球21个篮球联盟、4大洲30多个国家。该数据集特别注重参与者多样性,包含不同性别、种族、年龄和技术水平的球员。其核心价值在于细粒度的20项篮球技能标注,涵盖投篮、篮板、防守等五大类,每项技能分为五个等级。相比现有技能评估数据集,BASKET的视频时长更长(平均500秒),为长期视频理解提供了独特挑战。
使用方法
使用BASKET数据集时,研究者需处理长约8-10分钟的高光视频输入,通过多路视频分类方法预测20项篮球技能等级。数据集按7:1:2比例划分为训练、验证和测试集,并特别设置了跨赛季和跨联盟的泛化测试子集。评估采用top-1准确率指标,需对20项技能的平均表现进行分析。为应对长视频处理挑战,建议采用具有长期时序建模能力的架构,同时注意模型需要从原始视频中自动识别目标球员并分析其技术细节这一双重挑战。
背景与挑战
背景概述
BASKET数据集由北卡罗来纳大学教堂山分校的研究团队于2025年提出,旨在通过大规模篮球视频数据推动细粒度技能评估研究。该数据集包含4,477小时视频,覆盖全球21个篮球联赛的32,232名球员,在参与者多样性(性别、年龄、技能水平等)和地理分布(4大洲30个国家)方面具有突破性意义。其核心研究问题聚焦于通过8-10分钟的长时视频,评估球员在20项篮球技能(如三分投篮、传球、防守等)的五级水平分类。相较于现有技能评估数据集(如Ego-Exo4D、JIGSAWS),BASKET在规模、技能维度和时间跨度上的优势,为视频理解模型在长时序分析和细粒度动作识别领域设立了新基准。
当前挑战
该数据集面临双重挑战:在领域问题层面,现有视频模型(如VideoMamba、InternVideo2)对长视频中细微技能差异的捕捉能力不足,最佳模型准确率(28.5%)显著低于人类专家基线(72%),凸显模型在时空推理和技能语义理解上的缺陷;在构建层面,数据采集需处理跨赛季、跨联赛的球员表现动态变化,专家标注需协调不同联赛评分标准的一致性,而长视频剪辑生成需平衡事件覆盖密度与计算效率。此外,模型需克服无边界框标注下的球员追踪难题,以及从有限事件片段中推断整体技能水平的表征学习挑战。
常用场景
经典使用场景
在计算机视觉与体育分析交叉领域,BASKET数据集为细粒度技能评估任务提供了标准化的测试平台。该数据集通过长达8-10分钟的高光视频片段,要求模型对篮球运动员的20项细分技能进行五级评分,这种长时程视频理解与微观动作分析相结合的范式,已成为评估视频模型时空建模能力的黄金标准。其4477小时的视频体量和32232名运动员的覆盖规模,使得该数据集特别适合研究数据驱动模型在真实场景下的泛化性能。
解决学术问题
BASKET有效解决了体育视频分析中三个核心学术问题:长视频时序建模的算法瓶颈、跨场景细粒度动作识别的表征学习难题,以及技能评估中的多维度标签不平衡问题。实验表明,现有最佳模型VideoMamba仅达到28.5%的准确率,远低于人类专家72%的水平,这揭示了当前视频理解模型在微观动作特征提取和长程依赖建模方面的理论缺陷。数据集通过统一量化不同联赛、性别和年龄段的技能表现,为建立跨域可迁移的评估体系提供了基准。
衍生相关工作
BASKET的发布推动了多项衍生研究:VideoMamba-Sports通过状态空间模型改进长视频处理效率;SkillNet架构引入多尺度时空注意力机制专门优化技能评估任务。在跨模态方向,BASKET-LLM探索了视频与文本描述的结合用于技能解释生成。这些工作共同构成了新一代体育视频分析的技术矩阵,相关成果已应用于NBA等职业联盟的数据分析系统。
以上内容由遇见数据集搜集并总结生成



