five

football-player-stats-2022-2023

收藏
Hugging Face2025-11-17 更新2025-11-18 收录
下载链接:
https://huggingface.co/datasets/talcabalo/football-player-stats-2022-2023
下载链接
链接失效反馈
官方服务:
资源简介:
2022-2023赛季欧洲主要联赛足球运动员传球统计数据集
创建时间:
2025-11-13
原始信息汇总

足球球员传球统计数据(UEFA 2022–2023)数据集概述

数据集基本信息

  • 数据集名称:football-player-stats-2022-2023
  • 文件名称:players_clean_for_EDA.csv
  • 赛季:2022–2023
  • 球员数量:各联赛不同
  • 数据来源:基于公开足球统计数据(FBref/StatsBomb开放数据)编制
  • 许可证:CC BY 4.0(需要署名)

研究重点

  • 探索球员位置如何影响传球表现
  • 确定中场球员(MF)是否比其他位置(DF、FW、GK)更有效和准确

关键研究问题

  1. 中场球员是否比其他位置提供更多助攻?
  2. 哪个位置对传入禁区的传球贡献最大?
  3. 哪个位置保持最高的传球准确率?
  4. 出场时间与传球准确率之间是否存在关系?

数据准备

  • 原始数据集经过清理并保存为players_clean_for_EDA.csv
  • 删除不相关和重复的列
  • 适当处理缺失值
  • 标准化和重命名列以确保一致性

关键数据列

  • Player、Nation、Squad、MainPos
  • Assists、Pass_Accuracy_Total (%)、Pass_Accuracy_Medium (%)、Pass_Accuracy_Long (%)
  • Progressive_Passes、Passes_into_Penalty_Area、Min、90s

探索性数据分析关键发现

助攻分布

  • 中场球员(MF)和前锋(FW)每名球员的助攻数最高
  • 中场球员充当组织核心,后卫和守门员很少贡献

传入禁区传球

  • 中场球员显示出传入禁区传球的中位数最高,其次是后卫(主要是边后卫)
  • 前锋和守门员贡献最小

传球准确率

  • 中场球员保持最平衡和一致的传球准确率
  • 后卫在短/中距离传球中准确率略高
  • 前锋准确率较低,因为他们尝试风险更高的传球
  • 守门员在短传和中距离传球中保持高准确率,但长传显著下降

出场时间与传球准确率关系

  • 皮尔逊相关性(r = 0.15, p < 0.001)表明存在弱正相关
  • 出场时间对传球准确率影响不大,更多取决于技术和战术角色

总助攻分布

  • 中场球员:约60%的总助攻
  • 前锋:约24%
  • 后卫:约17%
  • 守门员:约0%

关键洞察总结

  • 中场球员在助攻量和传球准确率方面始终是最高贡献者
  • 后卫在组织进攻中发挥关键支持作用
  • 出场时间对准确率水平影响很小
  • 数据有力支持中场球员是现代足球核心创造力的假设

项目信息

  • 作者:Tal Cabalo
  • 项目类型:数据分析和EDA作业(Reichman University, 2025)
  • 分析工具:Python、Pandas、Seaborn和Matplotlib
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于2022-2023赛季欧洲主要联赛的公开足球统计数据构建,原始数据来源于FBref和StatsBomb等权威平台。通过系统性的数据清洗流程,研究人员移除了冗余字段与重复记录,对缺失值进行了标准化处理,并将关键指标如传球准确率、助攻次数等重新命名以保持一致性,最终形成可供探索性分析的规范化数据集。
特点
本数据集聚焦于球员位置与传球表现的关联性研究,涵盖中场、前锋、后卫及守门员四类核心位置的对比分析。其特色在于通过多维度传球指标揭示战术规律,包括渐进式传球、禁区渗透传球等精细化数据,并运用统计验证展现中场球员在创造力和传球稳定性方面的核心作用,为足球战术分析提供量化支撑。
使用方法
研究者可借助该数据集开展足球战术表现的探索性分析,通过可视化工具对比不同位置球员的传球效率与助攻贡献。数据支持回归分析、相关性检验等统计方法,例如验证出场时间与传球准确性的关联程度。此外,数据集可直接用于复现原研究中的图表生成与假设检验流程,为体育数据分析提供基准参照。
背景与挑战
背景概述
足球运动员统计数据集作为体育数据分析领域的重要载体,由Reichman大学的Tal Cabalo于2025年构建,聚焦2022-2023赛季欧洲主要联赛的职业球员表现。该数据集通过系统化采集传球精度、助攻分布等核心指标,旨在量化解析不同场上位置球员的技术特征。其创新性在于将传统战术观察转化为可验证的数值模型,为足球战术决策与球员评估提供了数据支撑,推动了体育科学从经验主义向实证研究的范式转变。
当前挑战
该数据集致力于攻克足球运动中的技术效能量化难题,需精准区分不同位置球员在传球精度与创造性贡献的细微差异。构建过程中面临多源异构数据整合的复杂性,包括原始统计指标的标准化处理、缺失值的合理插补以及位置分类体系的统一。此外,球员战术角色的动态性与联赛风格差异对数据可比性构成潜在干扰,需通过特征工程与统计验证确保分析结论的普适性。
常用场景
经典使用场景
在足球数据分析领域,该数据集被广泛应用于探索球员传球表现与场上位置之间的关联。通过整合欧洲主流联赛2022-2023赛季的传球精度、助攻次数等关键指标,研究者能够系统分析中场球员作为组织核心的技术特征,揭示不同位置球员在进攻组织中的功能差异。
解决学术问题
本数据集有效解决了足球战术分析中关于位置专业化与传球效率的量化研究难题。通过精确记录长短传准确率、渐进式传球等维度数据,为验证'中场球员是进攻组织核心'的经典假说提供了实证支持,同时揭示了比赛时间与传球稳定性之间的微弱相关性,推动了体育科学领域的因果推断研究。
衍生相关工作
基于该数据集衍生的研究催生了多项创新工作,包括开发基于机器学习的传球模式预测模型,构建球员价值评估体系。这些研究不仅深化了对位置足球理论的理解,还推动了体育数据分析方法论的发展,为足球产业数字化转型升级提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作