SHOT Dataset
收藏arXiv2025-09-25 更新2025-09-27 收录
下载链接:
https://xinyi-hu.github.io/SHOT_DATASET
下载链接
链接失效反馈官方服务:
资源简介:
SHOT数据集是一个大规模的篮球视频数据集,包含1979个视频片段,从5个不同视角捕获,并标注了6种个人属性。数据集设计有3个关键特点:多个人信息、多视角适应性和多层次意图,使其非常适合研究新兴的集体意图。数据集为研究集体意图预测提供了强大的基础。
提供机构:
武汉大学,清华大学,北京大学,新加坡国立大学
创建时间:
2025-09-25
原始信息汇总
SHOT数据集概述
数据集基本信息
- 数据集名称: SHOT
- 任务定义: 群体意图预测(Group Intention Forecasting,GIF)
- 数据规模: 1,979个篮球视频片段
- 数据来源: NBA集锦和完整比赛回放
- 相机视角: 5个不同视角(View1至View5),每个视角间隔30°,其中View3覆盖中央60°
数据内容与标注
- 标注类型: 6类个体属性(边界框、姿态、注视、头部姿态、速度、角色)
- 意图层级: 多层级意图标注,包括群体意图和个体意图
- 战术分类: 54种战术场景,基于四个维度组合:
- 传球频率(无传球、一次传球、多次传球)
- 挡拆频率(无挡拆、一次挡拆、多次挡拆)
- 突破存在(有突破、无突破)
- 投篮类型(投篮、上篮、扣篮)
数据集特点
- 多个体信息: 覆盖所有10名球员的特征标注
- 多视角适应性: 提供5个相机视角的视频数据
- 多层级意图: 同时标注个体意图和群体意图
数据构建流程
- 视频片段选择: 使用LosslessCut软件手动裁剪,确保每个片段仅包含一次进攻投篮尝试且所有球员均可见
- 视角分类: 按相机角度分为5类
- 战术分类: 基于关键词观察和确认进行战术标注
- 标注存储: 视频标注以JSON格式存储
数据集统计信息
- 球队分布: 按主场球队统计视频数量,显示不同NBA分区的战术偏好
- 战术统计: 统计每种战术分类的视频数量
- 团队战术偏好: 揭示不同分区的战术特点,例如东南分区更偏好多次挡拆战术
应用场景
- 群体意图预测任务
- 篮球战术分析
- 多视角视频理解
- 时空图卷积网络(STGCN)等方法的评估
搜集汇总
数据集介绍

构建方式
在群体意图识别研究领域,SHOT数据集的构建遵循系统化流程,涵盖从原始视频筛选到多维度标注的全过程。数据来源于NBA篮球比赛的高清视频素材,通过专业标注团队对1979个战术片段进行精细处理,每个片段均包含球场全部十名球员的完整动态。标注过程采用人工与算法结合的方式,对边界框、姿态、视线方向等六类个体属性进行标注,并通过多轮交叉验证确保数据质量的一致性。
特点
该数据集的核心价值体现在其多维度特性设计上。通过融合多视角拍摄与细粒度标注,SHOT能够捕捉篮球比赛中群体意图形成的动态过程。其多个体信息模块记录了球员的微观行为特征,多视角适应性设计有效解决了单视角遮挡问题,而多层次意图标注则同步呈现了个体行为与群体协作的关联性。这种立体化数据结构为分析群体意图的涌现机制提供了丰富的研究素材。
使用方法
研究者可基于该数据集开展群体意图预测任务的模型训练与验证。典型应用流程包括从多视角视频中提取球员的异构特征,通过时空图神经网络建模个体间交互动态,进而预测群体意图的发生时机。数据集提供的标准化标注格式支持端到端的算法开发,其划分的训练集与测试集便于进行模型性能评估。该设计尤其适合探索早期观测帧与群体意图形成间的因果关系。
背景与挑战
背景概述
群体意图识别作为计算机视觉领域的前沿研究方向,旨在理解多人协作场景中共享目标的形成机制。SHOT数据集由武汉大学、北京大学等机构的研究团队于2025年联合发布,聚焦篮球运动中的群体投篮意图预测问题。该数据集包含1,979段从5个视角采集的高清视频片段,标注了边界框、姿态、视线等6类个体属性,首次将研究视角从个体意图扩展到群体动态演化。其多视角适配性与多层次意图标注体系,为分析团队协作中的隐性意图涌现提供了重要数据基础,推动了智能体育分析、公共安全监测等领域的发展。
当前挑战
群体意图预测任务面临双重挑战:在领域问题层面,需从早期稀疏个体行为中捕捉群体意图的隐性表征,例如篮球进攻中传球与跑位的时空关联性;同时需解决群体动态演化的非线性建模难题,包括个体间交互影响的量化与意图形成的时间维度预测。在数据集构建层面,多视角视频的时空对齐与标注一致性保障要求极高,需通过混合排序算法实现10名球员的跨视角身份追踪;细粒度标注如头部朝向与视线方向的精准提取,需结合RTMO、L2CS-Net等多模型协同,而战术场景的54类分类体系则要求标注者具备专业的领域知识。
常用场景
经典使用场景
在群体行为分析领域,SHOT数据集通过篮球比赛视频片段为群体意图预测任务提供了标准化实验平台。该数据集最经典的使用场景体现在对进攻方投篮意图的早期识别上,研究者可利用前τ帧的球员姿态、视线方向等细粒度特征,通过时空图卷积网络建模球员间的动态交互,从而预测投篮行为的发生时间。这种基于多视角视频和丰富标注的范式,为理解群体协同行为的形成机制提供了重要数据支撑。
解决学术问题
该数据集突破了传统意图识别研究局限于个体层面的瓶颈,首次系统性地解决了群体意图的量化表征问题。通过提供多视角视频流与六类个体属性标注,支持研究者探索从个体行为到群体目标的涌现规律,填补了群体动力学研究中早期意图预测的理论空白。其多层级意图标注体系为理解个体行动如何通过时空协调形成集体目标提供了新的分析维度,推动了人机交互与智能安防等领域对群体行为认知模型的深化。
衍生相关工作
基于SHOT数据集提出的GIFT框架催生了群体智能预测的新研究方向,其编码器-解码器架构与异质特征融合方法被后续研究广泛借鉴。例如在团队竞技视频分析中,研究者扩展了多模态特征提取模块以涵盖语音指令识别;在社交机器人领域,出现了基于群体意图预测的协同决策算法。该数据集还促进了跨视角行为分析技术的发展,如通过注意力机制解决视角模糊问题的方法,为多智能体系统的协同认知建模提供了重要参考。
以上内容由遇见数据集搜集并总结生成



