NBA数据集
收藏github2024-11-14 更新2024-11-16 收录
下载链接:
https://github.com/KristWangCY/BusinessDataMiningProject
下载链接
链接失效反馈官方服务:
资源简介:
包含2021-2024年NBA球员的表现和薪水数据,用于预测球员是否能成为全明星球员、分析表现与薪水之间的关系,以及寻找有潜力的年轻球员。
Contains performance and salary data of NBA players from 2021 to 2024. This dataset is utilized to predict whether a player can become an All-Star, analyze the correlation between performance and salary, and identify promising young players.
创建时间:
2024-11-14
原始信息汇总
BusinessDataMiningProject
数据集概述
- 数据集名称: BusinessDataMiningProject
- 数据来源: NBA球员表现和薪资数据(2021-2024)
数据文件描述
- 2021-2022 NBA Player Stats - Regular.csv: 2021-2022 NBA球员常规赛表现数据
- 2022-2023 NBA Player Stats - Regular.csv: 2022-2023 NBA球员常规赛表现数据
- 2023-2024 NBA Player Stats - Regular.csv: 2023-2024 NBA球员常规赛表现数据
- 2021-2024PlayersSalaries.csv: 2021-2024 NBA球员薪资数据
代码文件描述
- Code_2_15AllStarPlayersSalaries.csv: 用于Code2_RelationshipBetweenPerformanceAndSalaries.R,包含从预测的AllStarPlayers中选出的15名AllStar球员
- Code1_PredictAllStarPlayers.R: 使用2023-2024 NBA球员常规赛表现数据,预测球员是否能在该赛季成为全明星球员
- Code2_RelationshipBetweenPerformanceAndSalaries.R: 使用2021-2024 NBA球员常规赛表现和薪资数据,分析表现与薪资之间的关系,并预测2024-2025赛季每位球员的薪资
- Code3_FindPotentialPlayers.R: 使用从Code2中获得的表现和薪资数据,寻找薪资与表现不匹配的球员,识别年轻且有潜力的球员,并将其分类为高、中、低潜力球员
项目目标
- 预测全明星球员: 基于球员表现预测其是否能成为全明星球员,影响各球队的收入
- 分析表现与薪资关系: 分析2021-2024年球员表现与薪资之间的关系,帮助管理层做出决策,如调整薪资帽
- 寻找年轻潜力球员: 寻找年轻且有潜力的球员,帮助管理层进行球员交易
项目结果
- 预测全明星球员: 成功预测了全明星球员
- 分析表现与薪资关系: 发现安东尼·爱德华兹(Anthony Edwards)年轻且在场上表现出色,建议寻找更多类似年轻有潜力的球员
- 寻找年轻潜力球员: 生成了年轻且有潜力球员的名单,并将其分类为高、中、低潜力球员
团队成员
- CHENYU WANG
- GEUNJU PARK
- PANAGIOTIS GEORGIADIS
- SHANSHAN TAN
- XIAOXUE JI
最后更新日期
- 2024/11/14
搜集汇总
数据集介绍

构建方式
NBA数据集的构建基于2021年至2024年的球员表现和薪资数据。数据来源包括常规赛季的球员统计数据和球员薪资信息。通过收集和整理这些数据,构建了包含多个赛季的球员表现和薪资的完整数据集。数据清洗过程确保了数据的准确性和一致性,为后续的分析和模型训练提供了坚实的基础。
特点
该数据集的显著特点在于其涵盖了多个赛季的球员表现和薪资数据,为研究球员表现与薪资之间的关系提供了丰富的资源。此外,数据集还包含了预测全明星球员和潜在年轻球员的模型代码,这些代码展示了如何利用数据进行预测和分类。数据集的结构化和标准化处理使得数据易于访问和分析,适合用于多种商业和学术研究。
使用方法
使用NBA数据集时,用户可以首先加载包含球员表现和薪资的CSV文件,进行数据清洗和预处理。随后,可以利用提供的R代码进行模型训练和预测,例如预测全明星球员或分析球员表现与薪资的关系。数据集还提供了详细的代码示例和文档,帮助用户理解和应用数据集中的信息。通过这些步骤,用户可以有效地利用数据集进行深入的分析和研究。
背景与挑战
背景概述
NBA数据集是由CHENYU WANG、GEUNJU PARK、PANAGIOTIS GEORGIADIS、SHANSHAN TAN和XIAOXUE JI等研究人员于2021年至2024年间创建的,旨在分析和预测NBA球员的表现与薪资关系。该数据集的核心研究问题包括预测球员是否能成为全明星球员、分析球员表现与薪资的关系,以及识别具有潜力的年轻球员。这些研究不仅有助于球队管理层做出更科学的决策,如调整薪资帽和进行球员交易,还对篮球运动的数据分析领域产生了深远影响。
当前挑战
NBA数据集在构建过程中面临多项挑战。首先,数据清洗是确保分析准确性的关键步骤,需要处理大量复杂的数据。其次,通过主成分分析(PCA)和随机森林模型来确定变量的权重和预测结果,这一过程需要高度的统计学知识和计算能力。此外,识别异常数据(如Anthony Edwards)并进行专门研究,增加了分析的复杂性。最后,如何准确分类年轻球员的潜力,并预测其未来薪资,是该数据集面临的另一大挑战。
常用场景
经典使用场景
NBA数据集的经典使用场景之一是预测球员是否能成为全明星球员。通过分析球员的表现数据,如得分、篮板、助攻等,结合随机森林模型,可以评估球员的综合表现,并预测其成为全明星球员的概率。这一应用不仅有助于球队管理层制定策略,还能影响球队的收入和市场价值。
实际应用
NBA数据集在实际应用中主要用于球员交易和薪资调整。通过分析年轻球员的表现和潜力,球队管理层可以识别出具有高潜力的年轻球员,并据此进行球员交易。此外,数据集还可以帮助管理层调整球员的薪资帽,确保球队的薪资结构合理,从而优化球队的整体表现和财务状况。
衍生相关工作
NBA数据集的广泛应用催生了多项相关研究工作。例如,有研究利用该数据集进行球员表现与薪资关系的深度分析,提出了新的薪资预测模型。此外,还有研究专注于年轻球员的潜力评估,开发了基于PCA和随机森林的潜力评分系统。这些衍生工作不仅扩展了数据集的应用范围,还为体育管理领域的研究提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成



