five

renumics/f1_dataset|赛车数据数据集|数据分析数据集

收藏
hugging_face2023-11-13 更新2024-03-04 收录
赛车数据
数据分析
下载链接:
https://hf-mirror.com/datasets/renumics/f1_dataset
下载链接
链接失效反馈
资源简介:
该数据集包含2023年蒙特利尔大奖赛的Formula1赛车遥测数据,通过Ergast API和fastf1库获取。数据集特征包括时间、驾驶员信息、圈数、速度、轮胎状态等,以及图像和嵌入序列数据。数据集分为训练集,包含1317个样本。
提供机构:
renumics
原始信息汇总

数据集概述

数据集信息

  • 特征列表:
    • Time: 类型为 duration[ns]
    • Driver: 类型为 string
    • DriverNumber: 类型为 string
    • LapTime: 类型为 duration[ns]
    • LapNumber: 类型为 float64
    • Stint: 类型为 float64
    • PitOutTime: 类型为 duration[ns]
    • PitInTime: 类型为 duration[ns]
    • Sector1Time: 类型为 duration[ns]
    • Sector2Time: 类型为 duration[ns]
    • Sector3Time: 类型为 duration[ns]
    • Sector1SessionTime: 类型为 duration[ns]
    • Sector2SessionTime: 类型为 duration[ns]
    • Sector3SessionTime: 类型为 duration[ns]
    • SpeedI1: 类型为 float64
    • SpeedI2: 类型为 float64
    • SpeedFL: 类型为 float64
    • SpeedST: 类型为 float64
    • IsPersonalBest: 类型为 bool
    • Compound: 类型为 string
    • TyreLife: 类型为 float64
    • FreshTyre: 类型为 bool
    • Team: 类型为 string
    • LapStartTime: 类型为 duration[ns]
    • LapStartDate: 类型为 timestamp[ns]
    • TrackStatus: 类型为 string
    • Position: 类型为 float64
    • Deleted: 类型为 bool
    • DeletedReason: 类型为 string
    • FastF1Generated: 类型为 bool
    • IsAccurate: 类型为 bool
    • DistanceToDriverAhead: 类型为 sequence,包含 float64
    • RPM: 类型为 sequence,包含 float64
    • Speed: 类型为 sequence,包含 float64
    • nGear: 类型为 sequence,包含 float64
    • Throttle: 类型为 sequence,包含 float64
    • Brake: 类型为 sequence,包含 float64
    • DRS: 类型为 sequence,包含 float64
    • X: 类型为 sequence,包含 float64
    • Y: 类型为 sequence,包含 float64
    • Z: 类型为 sequence,包含 float64
    • gear_vis: 类型为 image
    • speed_vis: 类型为 image
    • RPM_emb: 类型为 sequence,包含 float64
    • Speed_emb: 类型为 sequence,包含 float64
    • nGear_emb: 类型为 sequence,包含 float64
    • Throttle_emb: 类型为 sequence,包含 float64
    • Brake_emb: 类型为 sequence,包含 float64
    • X_emb: 类型为 sequence,包含 float64
    • Y_emb: 类型为 sequence,包含 float64
    • Z_emb: 类型为 sequence,包含 float64
    • portrait: 类型为 image

数据集分割

  • train:
    • 字节数: 561415487.5469999
    • 样本数: 1317

数据集大小

  • 下载大小: 300522146
  • 数据集大小: 561415487.5469999

配置

  • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
AI搜集汇总
数据集介绍
main_image_url
构建方式
本数据集的构建基于2023年蒙特利尔一级方程式大奖赛的赛事遥测数据,通过Ergast API获取,并利用fastf1库进行处理。数据涵盖了赛事中的各项详细指标,包括时间、速度、档位等,以及与之相关的图像数据,如档位可视化图像和速度可视化图像。数据集分为训练集,为后续模型训练和数据分析提供了丰富的信息资源。
特点
f1_dataset数据集的特点在于其包含的丰富维度信息,不仅包括基本的赛事数据,如驾驶员、圈数、时间等,还涉及更细粒度的数据,如各赛段的用时、速度、档位等序列数据,以及图像数据。此外,数据集中还包含了诸如是否为个人最佳成绩、轮胎寿命等特殊信息,为深入分析提供了可能。
使用方法
使用该数据集时,用户首先需要通过pip安装renumics-spotlight工具。之后,利用datasets库加载数据集,并通过spotlight工具对数据进行可视化探索。用户可以根据需要选择不同的数据类型进行查看,如序列数据和嵌入数据等,从而对数据集有一个直观而深入的了解。
背景与挑战
背景概述
在赛车领域的数据科学研究中,'renumics/f1_dataset'数据集的构建具有里程碑意义。该数据集由Renumics团队在2023年创建,主要收集了蒙特利尔 Formula1 大奖赛的赛事遥测数据。数据集涵盖了驾驶员信息、圈时、速度、档位、刹车、油门等多种维度,为研究人员提供了深入了解赛车性能和驾驶行为的宝贵资源。该数据集不仅丰富了赛车运动的数据分析领域,也为智能驾驶系统的研发提供了实验基础。
当前挑战
该数据集在构建过程中面临着多方面的挑战。首先,赛车数据的实时采集和处理要求高,确保数据的准确性和实时性是关键。其次,数据的多维度特性和序列化的结构增加了存储和处理的复杂性。此外,如何在海量的数据中提取有效信息,构建准确的数据模型,也是当前研究的重要挑战。在领域问题上,该数据集的挑战包括如何利用遥测数据提高赛车性能,优化驾驶策略,以及确保赛车的安全性和稳定性。
常用场景
经典使用场景
在当代赛车运动研究领域,renumics/f1_dataset数据集凭借其详尽的Formula1蒙特利尔2023大奖赛 telemetry数据,成为分析赛车性能、车手驾驶策略及赛事动态的重要工具。该数据集最经典的使用场景在于,通过对车手和时间数据的深入分析,研究者能够量化车手在不同赛段的表现,进而评估其驾驶技巧和策略的优劣。
实际应用
在实际应用中,renumics/f1_dataset数据集被广泛运用于车队策略分析、车手训练模拟以及赛车设计优化等领域。通过该数据集,车队能够精确分析比赛中每个环节的性能瓶颈,为车手提供针对性的训练,同时为赛车的设计迭代提供数据支持,增强赛车的竞争力。
衍生相关工作
基于renumics/f1_dataset数据集,学术界和工业界衍生出了大量相关研究工作,如赛事预测模型、车手行为模式分析以及赛车性能优化算法等。这些工作不仅丰富了赛车运动的科学理论体系,也为赛车运动的商业化推广提供了技术支撑。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

CIFAR-10

CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成,每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像,但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间,训练批次恰好包含来自每个类别的 5000 张图像。

OpenDataLab 收录

熟肉制品在全国需求价格弹性分析数据

为更好了解各市对熟肉制品的市场需求情况,本行业所有企业对相关熟肉制品需求弹性数据进行采集计算。如果熟肉制品需求量变动的比率大于价格变动的比率,那么熟肉制品需求富有弹性,说明顾客对于熟肉制品价格变化的敏感程度大,弹性越大,需求对价格变化越敏感,本行业所有企业可以在该市适当的降低熟肉制品价格来获得较多的收益。如果熟肉制品需求缺乏弹性,本行业所有企业可以在该市适当的提高熟肉制品价格来获得较多的收益。该项数据对本行业所有企业在全国的市场营销决策有重要意义。1.数据采集:采集相关熟肉制品在某一时间段全国的的需求数据和价格数据,按照市级进行整理归纳,得到该熟肉制品的需求量变动数值和价格变化数值。 2.算法规则:对采集得到的数据按照如下公式进行计算:需求弹性系数Ed=-(△Q/Q)÷(△P/P),得到需求弹性系数。式中:Q表示产品的需求量,单位为份;P表示产品的价格,单位为元;△Q表示需求量同比变动值,单位为份;△P表示价格同比变动值,单位为元。取需求弹性系数的绝对值|Ed|作为分析数据时的参考系数。 3.数据分析:根据|Ed|的数值可分析该熟肉制品的需求价格弹性。(1)|Ed|=1(单位需求价格弹性),说明需求量变动幅度与价格变动幅度相同;(2)1<|Ed|(需求富有弹性),说明需求量变动幅度大于价格变动幅度;(3)|Ed|<1(需求缺乏弹性),说明需求量变动幅度小于价格变动幅度。

浙江省数据知识产权登记平台 收录

NREL Wind Integration National Dataset (WIND) Toolkit

NREL Wind Integration National Dataset (WIND) Toolkit 是一个包含美国大陆风能资源和电力系统集成数据的综合数据集。该数据集提供了高分辨率的风速、风向、风能密度、电力输出等数据,覆盖了美国大陆的多个地理区域。这些数据有助于研究人员和工程师进行风能资源评估、电力系统规划和集成研究。

www.nrel.gov 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录