Big Data Cup 2025 Dataset|冰球比赛数据集|运动数据分析数据集
收藏数据集概述
数据集简介
该数据集包含由Stathletes跟踪的冰球事件数据,以及从广播视频生成的球员跟踪数据。事件数据已从Stathletes的原始数据转换,以增强可访问性和可解释性。事件类型包括射门、传球、抢断、 puck恢复、 dump in、 dump out、区域进入、争球和犯规。每个事件都提供了扩展的详细信息,并在必要时指出了相关的球员和球队。
数据下载
数据可通过以下链接下载:
数据文件示例
- 事件数据: 2024-10-13.Team.B.@.Team.A.-.Events.csv
- 跟踪数据: 2024-10-13.Team.B.@.Team.A.-.Tracking.csv
- 换人数据: 2024-10-13.Team.B.@.Team.A.-.Shifts.csv
- 相机方向索引: camera_orientations.csv
事件数据
字段说明
- 日期: 比赛日期(格式:yyyy-mm-dd)
- 主队: 主队名称
- 客队: 客队名称
- 节次: 比赛节次(1-3为常规时间,4+为加时)
- 时钟: 比赛时间(格式:mm:ss)
- 主队球员数: 主队当前在场球员数(3-6)
- 客队球员数: 客队当前在场球员数(3-6)
- 主队进球数: 主队当前进球数
- 客队进球数: 客队当前进球数
- 球队: 事件负责球队的ID
- 球员: 事件负责球员的ID
- 事件类型: 事件类型(如“传球”、“射门”等)
- X坐标: 事件发生的x坐标(范围:-100到100)
- Y坐标: 事件发生的y坐标(范围:-42.5到42.5)
- 坐标基于相机视角,团队方向索引在camera_orientations.csv中
- 详细信息1-4: 每个事件的附加详细信息(最多4个,因事件类型而异)
- 球员2: 事件中涉及的第二位球员的ID(因事件类型而异)
- X坐标2: 第二事件细节的x坐标(因事件而异)
- Y坐标2: 第二事件细节的y坐标(因事件而异)
跟踪数据
字段说明
- 图像ID: 游戏唯一标识符
- 节次: 游戏节次
- 游戏时钟: 游戏时间
- 球员或冰球: “球员”或“冰球”
- 球队: “主队”、“客队”或“n/a”(如果是冰球)
- 球员ID: 被跟踪球员的ID或球衣号码
- 冰场位置X(英尺): 球员或冰球在冰场上的x坐标
- 冰场位置Y(英尺): 球员或冰球在冰场上的y坐标
- 冰场位置Z(英尺): 球员或冰球在冰场上的z坐标(球员为1,冰球为0.02,进球时为冰球高度)
- 进球得分: 如果进球,则为“G”,否则为空
换人数据
字段说明
- 日期: 比赛日期
- 比赛名称: 比赛ID
- 球队名称: 球队ID
- 球员ID: 球员ID
- 换人编号: 球员的换人编号(按顺序递增)
- 节次: 换人发生的节次(1-3为常规时间,4+为加时)
- 开始时间: 换人开始时间(格式:mm:ss)
- 结束时间: 换人结束时间(格式:mm:ss)
- 换人时长: 换人持续时间(格式:mm:ss)
事件数据定义
射门
- 事件类型: 未成功的射门尝试(封堵、未命中或扑救)
- 涉及球员: 射门球员
- 坐标: 射门释放位置
- 事件细节: 射门类型、射门目标、是否有干扰、是否为一拍即射
进球
- 事件类型: 成功的射门尝试(进球)
- 涉及球员: 射门球员
- 坐标: 射门释放位置
- 事件细节: 射门类型、射门目标、是否有干扰、是否为一拍即射
传球
- 事件类型: 成功的传球尝试
- 涉及球员: 传球球员、目标球员
- 坐标: 传球释放位置、传球目标位置
- 事件细节: 传球类型(直接或间接)
未完成传球
- 事件类型: 未成功的传球尝试
- 涉及球员: 传球球员、目标球员
- 坐标: 传球释放位置、传球目标位置
- 事件细节: 传球类型(直接或间接)
抢断
- 事件类型: 导致控球权变化的抢断、传球拦截或赢得争球
- 涉及球员: 获得抢断的球员
- 坐标: 球员获得控球权的位置
Puck恢复
- 事件类型: 通过捡起松散的冰球获得控球权
- 涉及球员: 恢复冰球的球员
- 坐标: 球员获得控球权的位置
Dump In/Out
- 事件类型: 球员故意放弃控球权,将冰球推进到冰场前方
- 涉及球员: 推进冰球的球员
- 坐标: 球员释放冰球的位置
- 事件细节: 控球结果(保留或丢失)
区域进入
- 事件类型: 尝试将冰球从中立区带入进攻区
- 涉及球员: 带球球员、目标防守球员
- 坐标: 释放点或冰球越过蓝线的位置
- 事件细节: 进入类型(带球、推进、传球)
争球获胜
- 事件类型: 争球
- 涉及球员: 赢得争球的球员、输掉争球的球员
- 坐标: 争球点位置
犯规
- 事件类型: 犯规
- 涉及球员: 犯规球员、被犯规球员
- 坐标: 犯规位置
- 事件细节: 犯规类型(如:挥杆、绊倒、粗暴、钩住等)

VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录