NBA数据集|体育分析数据集|球员评估数据集
收藏BusinessDataMiningProject
数据集概述
- 数据集名称: BusinessDataMiningProject
- 数据来源: NBA球员表现和薪资数据(2021-2024)
数据文件描述
- 2021-2022 NBA Player Stats - Regular.csv: 2021-2022 NBA球员常规赛表现数据
- 2022-2023 NBA Player Stats - Regular.csv: 2022-2023 NBA球员常规赛表现数据
- 2023-2024 NBA Player Stats - Regular.csv: 2023-2024 NBA球员常规赛表现数据
- 2021-2024PlayersSalaries.csv: 2021-2024 NBA球员薪资数据
代码文件描述
- Code_2_15AllStarPlayersSalaries.csv: 用于Code2_RelationshipBetweenPerformanceAndSalaries.R,包含从预测的AllStarPlayers中选出的15名AllStar球员
- Code1_PredictAllStarPlayers.R: 使用2023-2024 NBA球员常规赛表现数据,预测球员是否能在该赛季成为全明星球员
- Code2_RelationshipBetweenPerformanceAndSalaries.R: 使用2021-2024 NBA球员常规赛表现和薪资数据,分析表现与薪资之间的关系,并预测2024-2025赛季每位球员的薪资
- Code3_FindPotentialPlayers.R: 使用从Code2中获得的表现和薪资数据,寻找薪资与表现不匹配的球员,识别年轻且有潜力的球员,并将其分类为高、中、低潜力球员
项目目标
- 预测全明星球员: 基于球员表现预测其是否能成为全明星球员,影响各球队的收入
- 分析表现与薪资关系: 分析2021-2024年球员表现与薪资之间的关系,帮助管理层做出决策,如调整薪资帽
- 寻找年轻潜力球员: 寻找年轻且有潜力的球员,帮助管理层进行球员交易
项目结果
- 预测全明星球员: 成功预测了全明星球员
- 分析表现与薪资关系: 发现安东尼·爱德华兹(Anthony Edwards)年轻且在场上表现出色,建议寻找更多类似年轻有潜力的球员
- 寻找年轻潜力球员: 生成了年轻且有潜力球员的名单,并将其分类为高、中、低潜力球员
团队成员
- CHENYU WANG
- GEUNJU PARK
- PANAGIOTIS GEORGIADIS
- SHANSHAN TAN
- XIAOXUE JI
最后更新日期
- 2024/11/14

poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
默沙东诊疗手册专业版
默沙东诊疗手册专业版
魔搭社区 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国区域地面气象要素驱动数据集 v2.0(1951-2020)
中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。
国家青藏高原科学数据中心 收录