andrewkroening/538-NBA-Historical-Raptor
收藏Hugging Face2022-11-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andrewkroening/538-NBA-Historical-Raptor
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了自1976年NBA-ABA合并以来每个NBA球员的赛季数据。数据集中的列包括球员姓名、球员ID、赛季、赛季类型、球队、上场时间、进攻和防守评分等。该数据集由Andrew Kroening为Hugging Face整理,并用于构建一个NBA WAR预测工具。
This dataset contains per-season performance data for every NBA player since the 1976 NBA-ABA merger. Columns included in the dataset cover player name, player ID, season, season type, team, minutes played, offensive and defensive ratings, and more. This dataset was curated by Andrew Kroening for Hugging Face, and was utilized to develop an NBA WAR prediction tool.
提供机构:
andrewkroening
原始信息汇总
数据集概述
数据集来源
本数据集由fivethirtyeight提供,原始及更新版本可在GitHub链接找到。
数据结构
列描述
| 列名 | 描述 |
|---|---|
player_name |
球员姓名 |
player_id |
Basketball-Reference.com球员ID |
season |
赛季 |
season_type |
赛季类型(常规赛或季后赛) |
team |
球队Basketball-Reference ID |
poss |
上场次数 |
mp |
上场分钟数 |
raptor_box_offense |
基于箱型估计的进攻端每100次进攻得分高于平均值 |
raptor_box_defense |
基于箱型估计的防守端每100次进攻得分高于平均值 |
raptor_box_total |
基于箱型估计的总得分高于平均值 |
raptor_onoff_offense |
基于正负值数据的进攻端每100次进攻得分高于平均值 |
raptor_onoff_defense |
基于正负值数据的防守端每100次进攻得分高于平均值 |
raptor_onoff_total |
基于正负值数据的总得分高于平均值 |
raptor_offense |
结合箱型和正负值数据的进攻端每100次进攻得分高于平均值 |
raptor_defense |
结合箱型和正负值数据的防守端每100次进攻得分高于平均值 |
raptor_total |
结合箱型和正负值数据的总得分高于平均值 |
war_total |
常规赛和季后赛的总胜利贡献值 |
war_reg_season |
常规赛的胜利贡献值 |
war_playoffs |
季后赛的胜利贡献值 |
predator_offense |
预测的进攻端每100次进攻得分高于平均值 |
predator_defense |
预测的防守端每100次进攻得分高于平均值 |
predator_total |
预测的总得分高于平均值 |
pace_impact |
球员对球队每48分钟进攻次数的影响 |
搜集汇总
数据集介绍

构建方式
在体育数据分析领域,538-NBA-Historical-Raptor数据集的构建体现了对历史篮球统计的系统性整合。该数据集源自FiveThirtyEight团队的开源数据仓库,涵盖了自1976年NBA-ABA合并以来每位球员的赛季表现记录。通过自动化脚本从篮球参考网站提取标准化数据,并采用RAPTOR算法对球员攻防贡献进行量化,最终形成包含球员标识、赛季类型、比赛时间及多维评分指标的完整数据框架。
特点
该数据集的核心特征在于其融合了传统统计与现代进阶指标的复合评估体系。不仅包含基础的出场时间与球权数据,更通过raptor_box与raptor_onoff两类计算模型,分别从基础数据与正负值角度量化球员效率。独特的预测性指标predator系列与胜利贡献值WAR指标,为球员价值评估提供了跨时代的可比性标准,而赛季类型细分与球队编码体系则增强了数据纵向分析的严谨性。
使用方法
研究者可通过HuggingFace平台直接加载该数据集进行篮球分析研究。典型应用场景包括球员历史价值趋势分析、球队构建策略评估以及机器学习模型训练。数据中的标准化指标允许跨赛季比较,而公开的Gradient工具示例展示了如何构建球员价值预测系统。使用时应结合篮球参考网站的元数据,并注意算法版本对历史数据解释的影响。
背景与挑战
背景概述
在体育数据分析领域,量化运动员的综合表现一直是核心研究课题。538-NBA-Historical-Raptor数据集由FiveThirtyEight团队创建,并由Andrew Kroening整理发布于Hugging Face平台。该数据集系统收录了自1976年NBA与ABA合并以来每位球员的赛季表现,其核心在于通过RAPTOR(Robust Algorithm using Player Tracking and On/Off Ratings)与WAR(Wins Above Replacement)等先进指标,深度评估球员在攻防两端的影响力。这些指标融合了传统技术统计与正负值数据,旨在更精确地衡量球员对比赛胜利的贡献,为篮球运动科学、球队管理与体育博彩分析提供了重要的数据基础。
当前挑战
该数据集致力于解决篮球运动员综合价值评估的复杂问题,其核心挑战在于如何精准量化球员在动态比赛中的真实贡献。传统数据往往忽略防守端与团队协作的影响,而RAPTOR模型需克服数据噪声、比赛节奏差异以及不同时代联赛风格变迁所带来的标准化难题。在构建过程中,研究人员面临历史数据完整性不足、原始数据源格式不一,以及将多维度统计信息(如正负值与基础数据)融合为统一指标的算法挑战。此外,确保跨赛季、跨球员的指标可比性,并处理因球员转会、伤病导致的样本偏差,亦是数据集构建中的关键难点。
常用场景
经典使用场景
在体育数据分析领域,538-NBA-Historical-Raptor数据集为研究者提供了自1976年NBA-ABA合并以来每位球员的赛季表现指标。该数据集通过RAPTOR(Robust Algorithm using Player Tracking and On/Off Ratings)模型,量化球员在攻防两端每百回合相对于联盟平均水平的贡献值,并结合Wins Above Replacement(WAR)指标评估球员对球队胜利的边际影响。经典使用场景包括构建球员价值评估模型,支持球队管理层在球员交易、选秀及阵容优化中进行数据驱动的决策。
解决学术问题
该数据集解决了体育科学中球员综合能力量化与长期绩效追踪的学术难题。传统篮球数据分析常依赖基础统计指标,难以剥离队友与对手影响,而RAPTOR模型融合了技术统计与正负值数据,提供了更稳健的球员影响力估计。其意义在于推动了体育计量学的发展,使研究者能够深入探讨球员老化曲线、阵容协同效应以及比赛风格演变等宏观议题,为职业体育的战术创新与管理科学提供了实证基础。
衍生相关工作
基于该数据集衍生的经典工作包括FiveThirtyEight团队开发的NBA预测系统,该系统整合历史RAPTOR数据与机器学习算法,定期发布赛季胜负与冠军概率预报。学术界则涌现出多篇探讨球员价值与薪资匹配度的研究论文,例如利用WAR指标分析球星溢价现象。开源社区中,开发者构建了交互式可视化工具与预测应用,如Hugging Face上部署的NBA WAR预测器,降低了公众接触高级篮球分析的门槛。
以上内容由遇见数据集搜集并总结生成



