five

HALO Hackathon 2026 Dataset

收藏
github2026-01-28 更新2026-01-29 收录
下载链接:
https://github.com/dwhite-teamworks/halo-hackathon-2026
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为HALO(Hockey Analytics League Operations)Hackathon专门策划的,包含来自2023-24 AHL赛季480场比赛的跟踪增强事件数据。数据集结合了事件数据(如争球、传球、冰球恢复、倾倒)和事件发生时球员的位置数据。由于跟踪数据来源于广播视频,位置数据可能不包含当时冰上所有球员的信息。数据集分为五个部分:`games`(每场比赛的记录)、`events`(每个事件的记录)、`stints`(每个球员每次上场的记录)、`players`(每个球员的记录)和`tracking`(每个球员每个事件的记录)。数据以parquet文件格式提供,可通过`game_id`、`player_id`和`sl_event_id`字段进行关联。

This dataset was specifically curated for the HALO (Hockey Analytics League Operations) Hackathon, containing tracking-enhanced event data from 480 games of the 2023-24 AHL season. The dataset combines event data (such as face-offs, passes, puck recoveries, and dump-ins) and the positional data of players at the time each event occurred. Since the tracking data is sourced from broadcast videos, the positional data may not include information about all players on the ice at that moment. The dataset is divided into five sections: `games` (records for each individual game), `events` (records for each individual event), `stints` (records for each player's on-ice shift), `players` (records for each individual player), and `tracking` (records for each player per event). The data is provided in Parquet file format and can be linked via the `game_id`, `player_id`, and `sl_event_id` fields.
创建时间:
2026-01-22
原始信息汇总

HALO Hackathon 2026 数据集概述

数据集来源与目的

  • 该数据集由 Teamworks 和 Sportlogiq 为 HALO(Hockey Analytics League Operations)黑客松提供。
  • 数据集旨在供已注册的黑客松参与者使用,通过数据驱动分析来探索冰球表现、战术和决策制定。

数据内容与范围

  • 数据来自2023-24赛季AHL(美国冰球联盟)的480场比赛。
  • 数据结合了事件数据(如争球、传球、冰球争抢、垫射)以及事件发生时的球员位置数据。
  • 由于位置数据源自比赛转播视频,因此并非每次事件发生时场上所有球员的位置数据都可用。

数据文件与结构

数据集包含五个独立的文件,可通过 game_idplayer_idsl_event_id 字段进行关联:

  1. games:每条记录对应一场比赛,包含球队和结果信息。
  2. events:每条记录对应一个事件。
  3. stints:每条记录对应一名球员在场上的一段连续出场时间(stint)。
  4. players:每条记录对应一名球员。
  5. tracking:每条记录对应一个事件中的一名球员。

数据格式与访问

  • 数据以 Parquet 文件格式提供以提高效率。
  • 建议使用 R 的 arrow::read_parquet() 或 Python 的 pd.read_parquet 进行读取。
  • 重要:数据集仅通过电子邮件分享给已注册的黑客松参与者。注册链接为:https://www.sportlogiq.com/halo-hackathon/

关键数据字段定义

  • home_start_net:主队比赛开始时球门位于 pos_x (89,0) 还是 neg_x (-89,0)。
  • game_stint:一段由特定球员组合在场上进行的连续比赛时段,任何球员上场或离场都会触发新的 game_stint
  • sequence_id:从争球到哨声间的一段连续比赛,每次争球到哨声的时段会触发新的 sequence_id
  • x, y, x_adj, y_adjx(范围-100到100)和 y(范围-42.5到42.5)是事件发生的冰面坐标;x_adjy_adj 经过调整,使主体球队的进攻区始终在右侧。
  • outcome:事件结果是成功、失败还是未定(导致既非成功也非失败结果的比赛停止)。
  • detail:具体细节,参见各 event_type 下的描述。

事件类型 (event_type) 详述

主要事件类型及其子类(detail 字段)包括:

  • faceoff (争球):如 recoveredwithentry, recoveredwithshotonnet 等。
  • lpr (冰球争抢):如 contested, rebound, opdump 等。
  • shot (射门):如 outside, slot, outsideblocked, slotblocked。
  • save (扑救):如 onfailedblock。
  • pass (传球):如 d2d, outlet, stretch, north, slot 等。
  • reception (接球):如 ozentry, regular。
  • puckprotection (护球)。
  • check (冲撞)。
  • controlledexit (控制性退出守区):如 carry, pass。
  • block (封挡)。
  • controlledentry (控制性进入攻区):如 carrywithplaywithshotonnet, passwithslotshot 等。
  • controlledentryagainst (防守控制性进入):描述攻防人数情况(如 1on1, 2on1)。
  • carry (带球越线)。
  • rebound (反弹球)。
  • dumpout (清区):如 ice, boards, flip。
  • dumpin (垫射):如 dump, chip。
  • penaltydrawn (造成犯规):列举了多种犯规类型。
  • penalty (犯规):列举了多种犯规类型。
  • offside (越位)。
  • icing (死球)。
  • assist (助攻):分 first, second。
  • soshot (射门尝试)。
  • sogoal (射门得分)。
搜集汇总
数据集介绍
main_image_url
构建方式
在冰球数据分析领域,HALO Hackathon 2026 Dataset的构建体现了专业赛事数据与追踪技术的深度融合。该数据集基于2023-24赛季美国冰球联盟(AHL)的480场比赛,通过整合事件数据与球员位置信息精心构建。事件数据涵盖了争球、传球、抢断等关键动作,而位置数据则来源于比赛视频的追踪技术,尽管并非所有场上球员在事件发生时都有完整的位置记录。数据集以五个独立的Parquet格式文件呈现,分别对应比赛、事件、球员上场时段、球员信息和追踪数据,并通过game_id、player_id和sl_event_id等唯一标识符实现高效关联,确保了数据的结构化和可扩展性。
特点
这一数据集的核心特点在于其多维度的冰球比赛表征能力。它不仅记录了传统的事件类型,如射门、传球和犯规,还引入了精细化的子类划分,例如传球事件细分为防守区传球、长传和进攻区切入传球等,从而捕捉战术执行的细微差异。数据集独特地融合了事件与追踪数据,提供了球员在特定事件发生时的空间坐标,并经过调整使进攻方向统一,便于分析团队的空间动态。此外,数据字段如game_stint和sequence_id支持对比赛连续性和球员上场模式的深入探索,为研究球员评估、团队结构和压力空间动态等主题提供了丰富的基础。
使用方法
使用该数据集时,参与者需首先通过注册获取访问权限,随后利用R或Python中的相应包(如arrow::read_parquet()或pd.read_parquet)读取Parquet格式文件。数据分析应围绕冰球决策支持展开,通过连接games、events、stints、players和tracking表,结合唯一标识符进行跨表查询,以构建完整的比赛场景。例如,可以分析球员在特定事件类型中的位置效率,或评估团队在进攻转换中的空间利用模式。提交成果时,需聚焦于将数据转化为可操作的洞察,强调对教练策略、球员使用或管理层决策的影响,并确保分析清晰、证据充分,符合科学研究的严谨性。
背景与挑战
背景概述
冰球运动数据分析领域近年来因追踪技术与事件记录的融合而迅速发展,旨在通过量化手段揭示比赛中的战术模式与决策效率。HALO Hackathon 2026数据集由Teamworks与Sportlogiq机构于2026年联合创建,专为冰球分析联盟黑客松设计,其核心研究问题聚焦于利用数据驱动方法探索冰球表现、战术策略及决策过程。该数据集基于2023-24赛季AHL联赛480场比赛的追踪增强事件数据,整合了球员位置信息与多样化事件类型,为研究者与从业者提供了评估球员能力、团队结构与空间动态的实证基础,对推动冰球运动科学化分析与战略优化具有显著影响力。
当前挑战
该数据集旨在解决冰球运动中的复杂分析问题,如球员评估、团队战术识别与压力空间量化,其挑战在于如何从多维度事件与不完整追踪数据中提取稳健特征,并建立可解释的模型以应对比赛的高动态性与不确定性。构建过程中的挑战主要源于数据采集与整合:追踪数据依赖广播视频衍生,导致部分球员位置信息缺失;事件类型的细粒度标注需平衡准确性与应用广度,且数据子集的结构化关联需通过多重标识符实现,增加了数据清洗与一致性维护的复杂度。
常用场景
经典使用场景
在冰球运动分析领域,HALO Hackathon 2026 Dataset为研究者提供了探索比赛表现、战术策略与决策过程的宝贵数据资源。该数据集整合了2023-24赛季AHL联赛480场比赛的追踪增强事件数据,涵盖争球、传球、射门等多种事件类型及球员位置信息,使得研究人员能够深入分析冰球比赛中的动态模式与团队协作机制。经典使用场景包括构建预期进球模型、评估球员在特定事件中的表现,以及识别球队在攻防转换中的战术阵型,从而为数据驱动的冰球分析奠定坚实基础。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在冰球分析的前沿领域。例如,基于追踪数据构建的预期进球模型已成为评估进攻效率的核心工具;针对松散球争夺事件的位置分析研究,深化了对球员防守意识的理解;团队阵型检测算法则帮助识别比赛中的战术模式变化。这些工作不仅拓展了冰球数据分析的边界,还为其他团队运动的数据建模提供了可借鉴的方法论,促进了运动科学与机器学习技术的交叉融合。
数据集最近研究
最新研究方向
在冰球运动数据分析领域,HALO Hackathon 2026数据集凭借其融合追踪与事件数据的特性,正推动前沿研究向精细化、动态化方向发展。当前研究热点聚焦于利用机器学习模型量化球员在压力下的空间创造与响应能力,例如通过追踪数据解析防守间距与过渡时机,以评估团队战术执行的效率。同时,该数据集支持开发集成位置信息的预期进球模型,深化对球员技术倾向与能力的多维度评价。这些探索不仅为教练组提供实时战术调整依据,也助力管理层在球员发展与团队构建中做出数据驱动的决策,体现了体育分析在提升竞技表现与运营智能化方面的深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作