five

space-creation-values

收藏
Hugging Face2026-03-30 更新2026-03-31 收录
下载链接:
https://huggingface.co/datasets/luxury-lakehouse/space-creation-values
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“空间创造值”,包含通过JAX加速的球场控制与球员移除技术(在A10G GPU上运行)计算的每球员每帧空间创造指标。数据集覆盖了7场IDSSE德甲比赛,共计726,210条球员-帧记录。空间创造量化了每位球员对无球得分机会(OBSO)的贡献,通过测量当该球员被假设从球场上移除时OBSO表面的变化来实现。数据集包含以下字段:比赛ID、帧ID、球员ID、球队(主场/客场)、半场、创造空间面积(平方米)、破坏空间面积(平方米)和净空间贡献(平方米)。数据计算参数包括52x34的网格分辨率、每个单元格4.04平方米的面积、每秒1帧的采样率以及StatsBomb 120x80坐标系。数据集以MIT许可证发布,基于IDSSE开放数据(CC-BY 4.0)计算得出。
创建时间:
2026-03-17
原始信息汇总

Space Creation Values 数据集概述

数据集基本信息

  • 数据集名称: Space Creation Values
  • 发布者: luxury-lakehouse
  • 许可证: MIT (基于IDSSE开放数据计算,原始数据许可证为CC-BY 4.0)
  • 标签: 足球、空间创造、球场控制、OBSO、分析、IDSSE、德甲
  • 数据规模: 100K-1M行

数据集内容与规模

  • 核心数据: 通过JAX加速的球场控制模型与球员移除假设,计算得出的逐球员逐帧空间创造指标。
  • 数据量: 包含 726,210 行球员-帧数据。
  • 覆盖范围: 源自 7场 IDSSE德甲比赛。

计算方法论

空间创造通过测量当某球员被假设性移出球场时,离球得分机会(OBSO)表面的变化,来量化每位球员对无球得分机会的贡献。

计算流程:

  1. 使用JAX计算包含所有球员的基准球场控制表面。
  2. 通过 jax.vmap 计算N个球员移除变体(每帧一次GPU调度)。
  3. 将每个球场控制表面转换为OBSO表面。
  4. space_created_m2: 因球员存在而导致OBSO增加的单元格面积总和。
  5. space_destroyed_m2: 因球员存在而导致OBSO减少的单元格面积总和。
  6. net_space_m2: 以平方米为单位的总OBSO贡献净值。

关键参数:

  • 网格分辨率: 52 x 34 单元格(总计1,768个)。
  • 单元格面积: 4.04 平方米。
  • 帧采样率: 1 fps(每25帧采样一次)。
  • 坐标系: StatsBomb 120x80。

文件结构

  • data/space_creation.parquet: 逐球员逐帧的数值数据(726,210行)。
  • metadata.json: 计算参数、时间戳和数据来源信息。

数据字段说明

字段名 类型 描述
match_id string 比赛标识符 (idsse_J03...)
frame_id int 追踪帧编号
player_id string DFL PersonId
team string 球员所属队伍 (home / away)
period int 比赛半场 (1 或 2)
space_created_m2 double 球员存在所增加的OBSO面积(平方米,>= 0)
space_destroyed_m2 double 球员存在所减少的OBSO面积(平方米,<= 0)
net_space_m2 double 净OBSO贡献(平方米,正数表示有益)

输入数据来源

  • 追踪数据: https://huggingface.co/datasets/luxury-lakehouse/pitch-control-tracking (IDSSE分区)
  • 训练网格: https://huggingface.co/datasets/luxury-lakehouse/obso-trained-grids

主要参考文献

  1. Fernandez, J. & Bornn, L. (2018). "Wide Open Spaces." MIT Sloan.
  2. Spearman, W. (2018). "Beyond Expected Goals." MIT Sloan.
  3. Bassek et al. (2025). "An integrated dataset of spatiotemporal and event data in elite soccer." Sci. Data.
搜集汇总
数据集介绍
main_image_url
构建方式
在足球分析领域,量化球员无球跑动对创造得分机会的贡献一直是研究难点。Space Creation Values数据集通过计算每名球员在假设被移除球场时对无球得分机会(OBSO)表面的影响来构建。该方法基于Fernandez与Bornn(2018)提出的空间创造理论,利用JAX加速的球场控制模型,在A10G GPU上对7场IDSSE德甲比赛的跟踪数据逐帧处理。每帧以1秒间隔采样,将球场划分为52×34的网格单元,通过jax.vmap并行计算球员移除变体,最终生成每名球员每帧的空间创造、破坏及净贡献面积,共计726,210行数据。
特点
该数据集的核心特点在于其高时空分辨率与计算效率的结合。数据覆盖了德甲联赛的完整比赛跟踪帧,以每帧1秒的采样频率捕捉动态比赛过程。网格分辨率达到52×34,每个单元面积4.04平方米,确保了空间度量的精细性。关键指标包括空间创造面积、空间破坏面积及净贡献面积,均以平方米为单位量化,直接映射到OBSO理论框架。数据格式采用Parquet存储,兼顾压缩效率与查询性能,并附有详细的元数据记录计算参数与数据来源,保证了可复现性与透明度。
使用方法
使用该数据集时,研究者可基于match_id、frame_id和player_id字段进行多层次分析。通过关联输入数据源如球场控制跟踪与训练网格,能够深入探究空间创造与比赛事件、球队战术的交互关系。典型应用包括评估球员无球跑动效率、识别关键空间创造时刻,或作为机器学习模型的输入特征预测比赛结果。数据以标准化坐标系统(StatsBomb 120x80)呈现,便于与现有足球分析工具集成。遵循MIT许可,用户可在CC-BY 4.0基础上自由用于学术研究或商业分析。
背景与挑战
背景概述
在足球运动分析领域,量化球员无球状态下的战术价值一直是前沿研究方向。Space Creation Values数据集由相关研究团队于2024年前后构建,其核心基于Fernandez与Bornn于2018年提出的空间创造理论,旨在通过计算球员在场时对离球得分机会表面的影响,精确评估每位球员在比赛每一帧中对团队进攻空间的贡献。该数据集依托德国足球甲级联赛的七场公开追踪数据,利用高性能JAX计算框架实现了大规模、细粒度的空间创造指标计算,为战术分析、球员评估及人工智能足球模型提供了重要的数据基础,推动了足球分析从描述性统计向因果性理解的范式转变。
当前挑战
该数据集致力于解决足球分析中量化无球跑动与空间创造这一复杂挑战,其核心在于将抽象的战术概念转化为可计算的物理指标。构建过程中的主要挑战包括:首先,需要在高维动态的球员追踪数据上实时计算球场控制表面,这对计算效率提出了极高要求;其次,基于假设性球员移除的方法需要处理大量并行计算,以确保在有限时间内完成超过72万行数据的生成;此外,将球场控制概率准确转换为离球得分机会,依赖于训练好的网格模型,其精度直接影响最终指标的可靠性。这些挑战共同指向了体育数据分析中计算复杂性、模型可解释性与数据规模之间的平衡难题。
常用场景
经典使用场景
在足球运动分析领域,空间创造价值数据集为量化球员无球跑动贡献提供了精细化的度量工具。该数据集通过JAX加速的球场控制模型,结合球员移除假设,逐帧计算每位球员对离球得分机会表面的影响,经典应用于评估中场组织者或前锋在进攻中的空间开拓能力。研究人员利用其高分辨率网格数据,能够深入解析战术执行过程中球员的微观决策,从而揭示传统统计指标难以捕捉的战术价值。
解决学术问题
该数据集有效解决了足球分析中无球跑动价值难以客观量化的学术难题。传统指标如传球成功率或射门次数往往忽略空间创造这一核心战术要素,而本数据集通过离球得分机会表面的变化,将抽象的空间贡献转化为可计算的平方米度量。这为验证战术理论模型、探究球员定位与团队进攻效率的因果关系提供了实证基础,推动了运动科学从描述性分析向因果推断的范式转变。
衍生相关工作
基于该数据集的度量框架,衍生出多项经典研究工作。例如,将空间创造指标与传球网络分析相结合,探究空间开拓与传球路径选择的协同机制;亦有研究将其扩展至防守端,量化后卫的空间破坏行为对对手进攻的抑制效果。此外,该数据集为机器学习模型提供了高质量标签,促进了球员动作预测、战术模式识别等跨学科应用的算法创新,持续丰富着足球分析的方法论体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作