Le Tour de France Data Set & Le Tour de France Femmes avec Zwift Data Set
收藏github2024-03-29 更新2024-05-31 收录
下载链接:
https://github.com/camminady/LeTourDataSet
下载链接
链接失效反馈官方服务:
资源简介:
包含2023年及之前的环法自行车赛所有自行车手和阶段的数据,分为男子和女子两个版本,数据存储在不同的CSV文件中。
This dataset encompasses comprehensive data on all cyclists and stages of the Tour de France up to and including the year 2023. It is segmented into two distinct versions for men and women, with the data meticulously stored in separate CSV files.
创建时间:
2018-07-26
原始信息汇总
数据集概述
数据集名称
- Le Tour de France Data Set
- Le Tour de France Femmes avec Zwift Data Set
数据内容
- 男性数据:存储在文件
data/TDF_Riders_History.csv中,包含所有环法自行车赛选手的信息。 - 女性数据:存储在文件名以
TDFF开头的文件中,包含所有环法女子自行车赛选手的信息。 - 阶段数据:存储在文件
data/TDF_Stages_History.csv中,包含所有阶段的详细信息。
数据获取方式
-
Python:使用
pandas库读取CSV文件。 python import pandas as pd df_men = pd.read_csv("https://raw.githubusercontent.com/camminady/LeTourDataSet/master/data/TDF_Riders_History.csv") df_women = pd.read_csv("https://raw.githubusercontent.com/camminady/LeTourDataSet/master/data/TDFF_Riders_History.csv") -
R:使用
readr包读取CSV文件。 R library(readr) df_men <- read_csv("https://raw.githubusercontent.com/camminady/LeTourDataSet/master/data/TDF_Riders_History.csv") df_women <- read_csv("https://raw.githubusercontent.com/camminady/LeTourDataSet/master/data/TDFF_Riders_History.csv")
数据集运行指南
- 在命令行中执行以下命令以安装环境和下载数据: python poetry install # 安装环境 poetry run python letourdataset/Downloader.py # 下载数据
搜集汇总
数据集介绍

构建方式
Le Tour de France数据集及其女性版本Le Tour de France Femmes avec Zwift数据集的构建基于官方赛事网站的历史数据。数据集通过爬取和整理官方赛事网站上的信息,将每位参赛车手的历史数据分别存储在CSV文件中。男性赛事数据存储在`TDF_Riders_History.csv`中,女性赛事数据则以`TDFF`为前缀的文件进行区分。为确保数据的完整性和一致性,数据集还包含了每一赛段的历史记录,分别存储在`TDF_Stages_History.csv`和`TDFF_Stages_History.csv`中。
特点
该数据集涵盖了Le Tour de France及其女性版本Le Tour de France Femmes avec Zwift的详细历史数据,包括每位参赛车手的表现记录以及每一赛段的具体信息。数据集以CSV格式存储,便于使用常见的数据分析工具进行处理。男性与女性赛事数据分别存储,确保了数据的独立性和清晰性。此外,数据集还提供了赛段距离与冠军平均配速的可视化图表,便于用户快速了解赛事趋势。
使用方法
用户可以通过Python或R语言轻松加载该数据集。在Python中,使用`pandas`库的`read_csv`函数即可直接读取CSV文件。R语言用户则可以通过`readr`包中的`read_csv`函数实现相同功能。此外,数据集还提供了命令行工具,用户可以通过运行`poetry install`安装环境,并通过`poetry run python letourdataset/Downloader.py`获取数据。数据集的使用文档详细说明了每一步操作,确保用户能够顺利获取并分析数据。
背景与挑战
背景概述
Le Tour de France Data Set & Le Tour de France Femmes avec Zwift Data Set 是由 Thomas Camminady 创建并维护的公开数据集,专注于记录环法自行车赛及其女子赛事的详细历史数据。该数据集首次发布于2023年,涵盖了自赛事创办以来所有参赛车手和赛段的信息,旨在为体育数据分析、历史研究以及赛事策略优化提供支持。通过将男子和女子赛事数据分别存储,数据集不仅确保了数据的完整性,还为性别平等研究提供了重要参考。该数据集在体育科学和数据分析领域具有广泛的应用潜力,特别是在自行车运动表现分析和赛事历史研究方面。
当前挑战
该数据集在构建过程中面临了多方面的挑战。首先,数据来源的准确性是一个关键问题,部分数据可能存在错误,尤其是来自官方赛事网站的信息。其次,数据整合的复杂性也不容忽视,由于赛事历史跨度较长,数据格式和记录方式可能存在不一致性,增加了数据清洗和标准化的难度。此外,女子赛事数据的相对稀缺性也使得数据集的完整性和代表性受到一定限制。在应用层面,如何利用这些数据进行深入的分析和建模,特别是在预测赛事结果或优化训练策略方面,仍是一个亟待解决的难题。
常用场景
经典使用场景
Le Tour de France数据集在体育科学和数据分析领域具有广泛的应用。研究者们常利用该数据集分析自行车比赛中的选手表现、赛道难度以及比赛策略。通过对历史数据的深入挖掘,可以揭示选手在不同赛道条件下的表现差异,进而为训练和比赛策略提供科学依据。
解决学术问题
该数据集为体育科学研究提供了丰富的历史数据,解决了自行车比赛中选手表现与赛道条件之间关系的研究难题。通过对选手速度、赛道距离等数据的分析,研究者能够量化比赛中的关键因素,进而为选手训练和比赛策略的优化提供数据支持。此外,该数据集还为性别差异在体育竞技中的研究提供了宝贵的数据资源。
衍生相关工作
基于Le Tour de France数据集,研究者们开展了多项经典工作。例如,有研究利用该数据集分析了选手在不同赛道条件下的表现差异,提出了基于数据的训练优化策略。此外,还有研究通过对比男女选手的比赛数据,探讨了性别差异在自行车竞技中的影响。这些研究不仅丰富了体育科学领域的理论体系,也为实际比赛和训练提供了科学指导。
以上内容由遇见数据集搜集并总结生成



