NBA数据集

github2024-11-14 更新2024-11-16 收录

下载链接：

https://github.com/KristWangCY/BusinessDataMiningProject

下载链接

链接失效反馈

官方服务：

资源简介：

包含2021-2024年NBA球员的表现和薪水数据，用于预测球员是否能成为全明星球员、分析表现与薪水之间的关系，以及寻找有潜力的年轻球员。

Contains performance and salary data of NBA players from 2021 to 2024. This dataset is utilized to predict whether a player can become an All-Star, analyze the correlation between performance and salary, and identify promising young players.

创建时间：

2024-11-14

原始信息汇总

BusinessDataMiningProject

数据集概述

数据集名称: BusinessDataMiningProject
数据来源: NBA球员表现和薪资数据（2021-2024）

数据文件描述

2021-2022 NBA Player Stats - Regular.csv: 2021-2022 NBA球员常规赛表现数据
2022-2023 NBA Player Stats - Regular.csv: 2022-2023 NBA球员常规赛表现数据
2023-2024 NBA Player Stats - Regular.csv: 2023-2024 NBA球员常规赛表现数据
2021-2024PlayersSalaries.csv: 2021-2024 NBA球员薪资数据

代码文件描述

Code_2_15AllStarPlayersSalaries.csv: 用于Code2_RelationshipBetweenPerformanceAndSalaries.R，包含从预测的AllStarPlayers中选出的15名AllStar球员
Code1_PredictAllStarPlayers.R: 使用2023-2024 NBA球员常规赛表现数据，预测球员是否能在该赛季成为全明星球员
Code2_RelationshipBetweenPerformanceAndSalaries.R: 使用2021-2024 NBA球员常规赛表现和薪资数据，分析表现与薪资之间的关系，并预测2024-2025赛季每位球员的薪资
Code3_FindPotentialPlayers.R: 使用从Code2中获得的表现和薪资数据，寻找薪资与表现不匹配的球员，识别年轻且有潜力的球员，并将其分类为高、中、低潜力球员

项目目标

预测全明星球员: 基于球员表现预测其是否能成为全明星球员，影响各球队的收入
分析表现与薪资关系: 分析2021-2024年球员表现与薪资之间的关系，帮助管理层做出决策，如调整薪资帽
寻找年轻潜力球员: 寻找年轻且有潜力的球员，帮助管理层进行球员交易

项目结果

预测全明星球员: 成功预测了全明星球员
分析表现与薪资关系: 发现安东尼·爱德华兹（Anthony Edwards）年轻且在场上表现出色，建议寻找更多类似年轻有潜力的球员
寻找年轻潜力球员: 生成了年轻且有潜力球员的名单，并将其分类为高、中、低潜力球员

团队成员

CHENYU WANG
GEUNJU PARK
PANAGIOTIS GEORGIADIS
SHANSHAN TAN
XIAOXUE JI

最后更新日期

2024/11/14

搜集汇总

数据集介绍

构建方式

NBA数据集的构建基于2021年至2024年的球员表现和薪资数据。数据来源包括常规赛季的球员统计数据和球员薪资信息。通过收集和整理这些数据，构建了包含多个赛季的球员表现和薪资的完整数据集。数据清洗过程确保了数据的准确性和一致性，为后续的分析和模型训练提供了坚实的基础。

特点

该数据集的显著特点在于其涵盖了多个赛季的球员表现和薪资数据，为研究球员表现与薪资之间的关系提供了丰富的资源。此外，数据集还包含了预测全明星球员和潜在年轻球员的模型代码，这些代码展示了如何利用数据进行预测和分类。数据集的结构化和标准化处理使得数据易于访问和分析，适合用于多种商业和学术研究。

使用方法

使用NBA数据集时，用户可以首先加载包含球员表现和薪资的CSV文件，进行数据清洗和预处理。随后，可以利用提供的R代码进行模型训练和预测，例如预测全明星球员或分析球员表现与薪资的关系。数据集还提供了详细的代码示例和文档，帮助用户理解和应用数据集中的信息。通过这些步骤，用户可以有效地利用数据集进行深入的分析和研究。

背景与挑战

背景概述

NBA数据集是由CHENYU WANG、GEUNJU PARK、PANAGIOTIS GEORGIADIS、SHANSHAN TAN和XIAOXUE JI等研究人员于2021年至2024年间创建的，旨在分析和预测NBA球员的表现与薪资关系。该数据集的核心研究问题包括预测球员是否能成为全明星球员、分析球员表现与薪资的关系，以及识别具有潜力的年轻球员。这些研究不仅有助于球队管理层做出更科学的决策，如调整薪资帽和进行球员交易，还对篮球运动的数据分析领域产生了深远影响。

当前挑战

NBA数据集在构建过程中面临多项挑战。首先，数据清洗是确保分析准确性的关键步骤，需要处理大量复杂的数据。其次，通过主成分分析（PCA）和随机森林模型来确定变量的权重和预测结果，这一过程需要高度的统计学知识和计算能力。此外，识别异常数据（如Anthony Edwards）并进行专门研究，增加了分析的复杂性。最后，如何准确分类年轻球员的潜力，并预测其未来薪资，是该数据集面临的另一大挑战。

常用场景

经典使用场景

NBA数据集的经典使用场景之一是预测球员是否能成为全明星球员。通过分析球员的表现数据，如得分、篮板、助攻等，结合随机森林模型，可以评估球员的综合表现，并预测其成为全明星球员的概率。这一应用不仅有助于球队管理层制定策略，还能影响球队的收入和市场价值。

实际应用

NBA数据集在实际应用中主要用于球员交易和薪资调整。通过分析年轻球员的表现和潜力，球队管理层可以识别出具有高潜力的年轻球员，并据此进行球员交易。此外，数据集还可以帮助管理层调整球员的薪资帽，确保球队的薪资结构合理，从而优化球队的整体表现和财务状况。

衍生相关工作

NBA数据集的广泛应用催生了多项相关研究工作。例如，有研究利用该数据集进行球员表现与薪资关系的深度分析，提出了新的薪资预测模型。此外，还有研究专注于年轻球员的潜力评估，开发了基于PCA和随机森林的潜力评分系统。这些衍生工作不仅扩展了数据集的应用范围，还为体育管理领域的研究提供了新的视角和方法。

以上内容由遇见数据集搜集并总结生成