five

Big Data Cup 2025 Dataset|冰球比赛数据集|运动数据分析数据集

收藏
github2024-12-12 更新2024-12-13 收录
冰球比赛
运动数据分析
下载链接:
https://github.com/bigdatacup/Big-Data-Cup-2025
下载链接
链接失效反馈
资源简介:
该数据集由Stathletes跟踪的冰球事件数据组成,数据来源于AHL,以及从广播视频生成的球员跟踪数据。数据集中的事件类型包括射门、传球、抢断、冰球恢复、抛入、抛出、区域进入、争球和犯规。每个事件都提供了扩展的详细信息,并在必要时标明了相关的球员和球队。
创建时间:
2024-12-12
原始信息汇总

数据集概述

数据集简介

该数据集包含由Stathletes跟踪的冰球事件数据,以及从广播视频生成的球员跟踪数据。事件数据已从Stathletes的原始数据转换,以增强可访问性和可解释性。事件类型包括射门、传球、抢断、 puck恢复、 dump in、 dump out、区域进入、争球和犯规。每个事件都提供了扩展的详细信息,并在必要时指出了相关的球员和球队。

数据下载

数据可通过以下链接下载:

数据文件示例

  • 事件数据: 2024-10-13.Team.B.@.Team.A.-.Events.csv
  • 跟踪数据: 2024-10-13.Team.B.@.Team.A.-.Tracking.csv
  • 换人数据: 2024-10-13.Team.B.@.Team.A.-.Shifts.csv
  • 相机方向索引: camera_orientations.csv

事件数据

字段说明

  • 日期: 比赛日期(格式:yyyy-mm-dd)
  • 主队: 主队名称
  • 客队: 客队名称
  • 节次: 比赛节次(1-3为常规时间,4+为加时)
  • 时钟: 比赛时间(格式:mm:ss)
  • 主队球员数: 主队当前在场球员数(3-6)
  • 客队球员数: 客队当前在场球员数(3-6)
  • 主队进球数: 主队当前进球数
  • 客队进球数: 客队当前进球数
  • 球队: 事件负责球队的ID
  • 球员: 事件负责球员的ID
  • 事件类型: 事件类型(如“传球”、“射门”等)
  • X坐标: 事件发生的x坐标(范围:-100到100)
  • Y坐标: 事件发生的y坐标(范围:-42.5到42.5)
    • 坐标基于相机视角,团队方向索引在camera_orientations.csv中
  • 详细信息1-4: 每个事件的附加详细信息(最多4个,因事件类型而异)
  • 球员2: 事件中涉及的第二位球员的ID(因事件类型而异)
  • X坐标2: 第二事件细节的x坐标(因事件而异)
  • Y坐标2: 第二事件细节的y坐标(因事件而异)

跟踪数据

字段说明

  1. 图像ID: 游戏唯一标识符
  2. 节次: 游戏节次
  3. 游戏时钟: 游戏时间
  4. 球员或冰球: “球员”或“冰球”
  5. 球队: “主队”、“客队”或“n/a”(如果是冰球)
  6. 球员ID: 被跟踪球员的ID或球衣号码
  7. 冰场位置X(英尺): 球员或冰球在冰场上的x坐标
  8. 冰场位置Y(英尺): 球员或冰球在冰场上的y坐标
  9. 冰场位置Z(英尺): 球员或冰球在冰场上的z坐标(球员为1,冰球为0.02,进球时为冰球高度)
  10. 进球得分: 如果进球,则为“G”,否则为空

换人数据

字段说明

  1. 日期: 比赛日期
  2. 比赛名称: 比赛ID
  3. 球队名称: 球队ID
  4. 球员ID: 球员ID
  5. 换人编号: 球员的换人编号(按顺序递增)
  6. 节次: 换人发生的节次(1-3为常规时间,4+为加时)
  7. 开始时间: 换人开始时间(格式:mm:ss)
  8. 结束时间: 换人结束时间(格式:mm:ss)
  9. 换人时长: 换人持续时间(格式:mm:ss)

事件数据定义

射门

  • 事件类型: 未成功的射门尝试(封堵、未命中或扑救)
  • 涉及球员: 射门球员
  • 坐标: 射门释放位置
  • 事件细节: 射门类型、射门目标、是否有干扰、是否为一拍即射

进球

  • 事件类型: 成功的射门尝试(进球)
  • 涉及球员: 射门球员
  • 坐标: 射门释放位置
  • 事件细节: 射门类型、射门目标、是否有干扰、是否为一拍即射

传球

  • 事件类型: 成功的传球尝试
  • 涉及球员: 传球球员、目标球员
  • 坐标: 传球释放位置、传球目标位置
  • 事件细节: 传球类型(直接或间接)

未完成传球

  • 事件类型: 未成功的传球尝试
  • 涉及球员: 传球球员、目标球员
  • 坐标: 传球释放位置、传球目标位置
  • 事件细节: 传球类型(直接或间接)

抢断

  • 事件类型: 导致控球权变化的抢断、传球拦截或赢得争球
  • 涉及球员: 获得抢断的球员
  • 坐标: 球员获得控球权的位置

Puck恢复

  • 事件类型: 通过捡起松散的冰球获得控球权
  • 涉及球员: 恢复冰球的球员
  • 坐标: 球员获得控球权的位置

Dump In/Out

  • 事件类型: 球员故意放弃控球权,将冰球推进到冰场前方
  • 涉及球员: 推进冰球的球员
  • 坐标: 球员释放冰球的位置
  • 事件细节: 控球结果(保留或丢失)

区域进入

  • 事件类型: 尝试将冰球从中立区带入进攻区
  • 涉及球员: 带球球员、目标防守球员
  • 坐标: 释放点或冰球越过蓝线的位置
  • 事件细节: 进入类型(带球、推进、传球)

争球获胜

  • 事件类型: 争球
  • 涉及球员: 赢得争球的球员、输掉争球的球员
  • 坐标: 争球点位置

犯规

  • 事件类型: 犯规
  • 涉及球员: 犯规球员、被犯规球员
  • 坐标: 犯规位置
  • 事件细节: 犯规类型(如:挥杆、绊倒、粗暴、钩住等)
AI搜集汇总
数据集介绍
main_image_url
构建方式
Big Data Cup 2025 Dataset的构建基于Stathletes追踪的冰球事件数据以及从广播视频中生成的球员追踪数据。该数据集通过将Stathletes的原始数据转换为更易访问和解释的格式,涵盖了多种事件类型,包括射门、传球、抢断、冰球恢复、界外球、区域进入、争球和犯规等。每个事件均提供了详细的扩展信息,并标明了相关球员和队伍。此外,数据集还包含了球员的换人数据和摄像机视角的索引,以确保数据的全面性和准确性。
特点
该数据集的显著特点在于其详细的事件分类和丰富的数据维度。每种事件类型不仅记录了基本的时间、地点和参与者信息,还提供了多达四个的补充细节,如射门类型、传球方式、犯规类型等。此外,数据集还包含了球员的实时位置追踪数据,以及冰球的高度和进球情况,为研究冰球比赛中的动态变化提供了全面的数据支持。
使用方法
使用Big Data Cup 2025 Dataset时,用户可以通过下载包含的事件数据、追踪数据和换人数据来进行分析。事件数据提供了比赛中的各种事件详细信息,追踪数据则记录了球员和冰球的实时位置,而换人数据则帮助分析球员的上场和下场时间。用户可以根据需要选择不同的数据文件进行组合分析,以研究比赛策略、球员表现或比赛动态。数据集的详细定义和示例文件也提供了清晰的使用指南,确保用户能够准确理解和应用数据。
背景与挑战
背景概述
Big Data Cup 2025 Dataset是由Stathletes追踪的冰球事件数据集,结合了从广播视频生成的球员追踪数据。该数据集旨在增强数据的可用性和可解释性,涵盖了多种事件类型,如射门、传球、抢断、 puck恢复、区域进入、争球和犯规等。每个事件都提供了详细的扩展信息,并标明了相关球员和队伍。该数据集的创建时间为2025年,主要研究人员或机构为Stathletes,其核心研究问题在于通过详细的事件和追踪数据,深入分析冰球比赛中的战术和球员表现,对冰球分析领域具有重要影响力。
当前挑战
Big Data Cup 2025 Dataset在构建过程中面临多项挑战。首先,数据集需要从原始数据中提取并翻译成更易理解和分析的格式,这要求对冰球比赛有深入的理解和专业的数据处理技术。其次,追踪数据的准确性也是一个重要挑战,尤其是从广播视频中提取球员和puck的位置信息,需要高精度的图像识别和处理算法。此外,数据集的多样性和复杂性也增加了分析的难度,研究者需要开发新的方法来处理和解释这些多维度的数据,以便从中提取有价值的战术和球员表现信息。
常用场景
经典使用场景
Big Data Cup 2025 Dataset的经典使用场景主要集中在冰球比赛的数据分析与战术优化。研究者可以利用该数据集对比赛中的各种事件进行详细分析,如射门、传球、抢断等,从而揭示球队和球员的表现模式。通过分析这些事件的时空分布,研究者能够识别出比赛中的关键战术节点,并为教练团队提供战术调整的依据。此外,该数据集还可用于开发和验证冰球比赛中的预测模型,如进球概率预测、球员表现评估等,从而提升比赛的观赏性和竞技水平。
解决学术问题
Big Data Cup 2025 Dataset解决了冰球比赛中多个重要的学术研究问题。首先,它为研究者提供了丰富的比赛事件数据,使得对比赛战术和球员表现的深入分析成为可能。其次,通过详细的事件坐标和时间戳,研究者可以精确地分析比赛中的时空动态,从而揭示比赛中的关键战术节点和球员行为模式。此外,该数据集还为冰球比赛中的预测模型提供了可靠的数据支持,如进球概率预测、球员疲劳度评估等,推动了冰球运动科学化的发展。
衍生相关工作
Big Data Cup 2025 Dataset的发布催生了一系列相关的经典工作。首先,基于该数据集的研究者开发了多种冰球比赛预测模型,如进球概率预测、球员表现评估等,这些模型在学术界和业界均获得了广泛关注。其次,该数据集为冰球比赛中的战术分析提供了新的视角,推动了战术优化和比赛策略的研究。此外,基于该数据集的可视化分析工具也得到了快速发展,帮助研究者和教练团队更直观地理解比赛数据。最后,该数据集还激发了冰球运动科学化研究的热潮,推动了冰球运动的整体发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

VoxBox

VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录