racing-gears

Hugging Face2026-03-31 更新2026-04-01 收录

下载链接：

https://huggingface.co/datasets/tobil/racing-gears

下载链接

链接失效反馈

官方服务：

资源简介：

Racing Gear Digits 是一个用于从赛车车载摄像头遥测覆盖层中检测档位数字（0-9）的图像分类数据集，并辅以 MNIST 数字以提高鲁棒性。该数据集包含 5,964 张训练图像和 1,003 张验证图像，均为 32×32 的灰度 PNG 图像，共分为 10 个类别（数字 0-9）。数据来源包括多个赛车视频源，如 TDS Racing IMSA Sebring 2026、Sebring Q Tobi Lap 6 和 Paul Ricard Alpine LMPh，以及 MNIST 手写数字作为补充。数据集对少数类别进行了增强处理，包括随机平移、亮度/对比度抖动和高斯噪声。适用于实时赛车车载视频流中的档位指示器识别任务。

创建时间：

2026-03-30

原始信息汇总

Racing Gear Digits 数据集概述

数据集基本信息

许可证: MIT
任务类别: 图像分类
标签: racing, telemetry, gear-detection, motorsport, digit-recognition, onboard-camera
数据集名称: Racing Gear Digits
数据规模: 1K<n<10K
配置: 默认配置包含训练集和验证集

数据详情

图像总数: 5,964 张训练图像 / 1,003 张验证图像
图像格式: 32×32 灰度 PNG 图像
类别: 10 类 (数字 0-9)
数据来源列: 用于区分 racing-original、paul-ricard-alpine、sebring-tobi-lap6、racing_aug (增强数据) 和 mnist
数据划分: 采用适当的分层划分，每个赛车数据源保留 15% 作为验证集
数据增强: 对训练样本少于 200 的赛车数字类别进行了增强

数据来源说明

来源	档位范围	样式描述
TDS Racing IMSA Sebring 2026 (原始)	1-6	灰色转速表盘上的白色数字
Sebring Q Tobi Lap 6	1-6	深色半透明叠加层上的白色数字
Paul Ricard Alpine LMPh	1-7	深色圆圈上的白色数字
MNIST 补充数据	0-9	手写数字 (用于泛化)

训练数据分布

数字	Racing (原始)	Sebring	Paul Ricard	增强数据	MNIST	总计
0	0	0	0	0	196	196
1	864	36	35	0	196	1,167
2	1,344	74	105	0	196	1,719
3	364	99	162	0	196	821
4	37	68	4	91	196	396
5	107	138	49	0	196	490
6	106	79	35	0	196	416
7	19	0	45	137	196	397
8	0	0	0	0	196	196
9	0	0	0	0	196	196

数据增强方法 (racing_aug)

对训练样本少于 200 的赛车类别生成合成样本：

随机平移: x/y 方向最多 ±3 像素的偏移
亮度抖动: 0.7–1.3 倍
对比度抖动: 0.8–1.2 倍
高斯噪声: σ=8，30% 的概率添加

使用方式

python from datasets import load_dataset

ds = load_dataset("tobil/racing-gears")

筛选仅包含真实赛车图像

racing = ds["train"].filter(lambda x: x["source"] not in ("mnist", "racing_aug"))

标准训练循环

for example in ds["train"]: image = example["image"] # PIL 图像, 32x32 灰度 label = example["label"] # 整数 0-9 source = example["source"] # 来源标识符

应用背景

该数据集为 mpv racing telemetry plugin 构建，该插件使用 mpv 的 screenshot-raw API 从赛车车载视频中读取嵌入式遥测数据，并实时渲染包含油门/刹车轨迹、档位指示器和转向位置的叠加层。档位数字通过一个小型 CNN (ONNX) 进行检测，该模型在 30fps 下通过 mpv 的 Lua 脚本环境中的 LuaJIT FFI 调用。

搜集汇总

数据集介绍

构建方式

在赛车运动数据分析领域，Racing Gear Digits数据集的构建体现了对真实场景的精准捕捉与系统性扩充。该数据集主要从多个赛车车载视频源中提取档位数字图像，包括TDS Racing IMSA Sebring 2026、Sebring Q Tobi Lap 6以及Paul Ricard Alpine LMPh等赛事录像，通过脚本自动化截取指定坐标区域的图像帧。随后采用分层抽样策略，从每个视频源中保留15%的样本作为验证集，确保数据分布的均衡性。针对原始数据中样本量不足的类别，通过随机平移、亮度对比度抖动及高斯噪声注入等方式生成增强样本，同时引入MNIST手写数字数据集以提升模型的泛化能力，最终形成包含5,964张训练图像和1,003张验证图像的标准化集合。

特点

该数据集的核心特点在于其高度专业化的应用场景与多层次的数据结构。所有图像均统一为32×32像素的灰度PNG格式，涵盖0至9共十个档位数字类别，并标注了每张图像的具体来源，如racing-original、paul-ricard-alpine等，便于研究者按需筛选。数据分布经过精心设计，不仅对少数类别进行了增强处理，还通过MNIST数据的补充平衡了各类别的样本数量，从而在保持赛车场景真实性的同时，有效缓解了类别不均衡问题。这种结构使得数据集既适用于特定领域的档位识别任务，也能支持更广泛的数字分类研究。

使用方法

使用该数据集时，研究者可通过Hugging Face的datasets库直接加载，并利用过滤功能灵活选取所需的数据子集，例如仅保留真实赛车图像以聚焦于实际应用场景。在模型训练过程中，每张图像以PIL格式提供，对应标签为整数型类别标识，来源信息则可用于分析不同数据源对模型性能的影响。数据集的构建脚本亦允许用户扩展新的视频源：通过指定视频路径与裁剪区域提取原始帧，生成标注文件后运行构建流程，即可将新数据无缝整合至现有框架中，为后续的算法迭代与跨场景验证提供了便利。

背景与挑战

背景概述

Racing Gear Digits数据集于近年由研究人员Tobil构建，旨在解决赛车车载视频流中实时读取档位指示数字的计算机视觉问题。该数据集聚焦于图像分类任务，专门用于识别赛车车载摄像头遥测叠加层中的档位数字（0-9），其设计灵感源于经典MNIST数据集，但针对实际应用场景进行了优化。数据集整合了多个真实赛车视频源，包括TDS Racing IMSA Sebring 2026、Sebring Q Tobi Lap 6及Paul Ricard Alpine LMPh等，并辅以MNIST手写数字以增强模型的泛化能力。通过提供结构化、分层划分的训练与验证样本，该数据集为赛车遥测分析、实时驾驶辅助系统及车载视频智能处理等领域的研究奠定了重要基础，推动了特定场景下数字识别技术的发展。

当前挑战

该数据集核心挑战在于解决赛车车载视频中档位数字的实时检测与分类问题，其难点源于实际应用场景的复杂性：数字可能出现在不同风格的仪表盘或半透明叠加层上，且受光照变化、运动模糊及视频压缩伪影等因素干扰，导致图像质量不一。构建过程中面临多重挑战：原始视频源中数字样本分布极不均衡，某些档位（如0、8、9）在真实赛车场景中几乎缺失，需依赖MNIST数据进行补充；为提升少数类样本的代表性，必须设计针对性的数据增强策略，包括随机平移、亮度对比度抖动及高斯噪声注入；此外，从连续视频帧中精确提取和标注档位区域，需克服时间同步与边界框定位的准确性难题，确保数据集的可靠性与实用性。

常用场景

经典使用场景

在赛车运动分析领域，Racing Gear Digits数据集为实时齿轮数字识别任务提供了关键支持。该数据集通过整合赛车车载摄像头视频流中的遥测叠加图像，专注于检测0至9的齿轮数字，其经典应用场景在于训练轻量级卷积神经网络模型，以实现对赛车视频中齿轮指示器的高精度实时识别。这一过程不仅模拟了真实赛道环境下的视觉挑战，如光照变化和运动模糊，还通过数据增强技术提升了模型在复杂场景中的鲁棒性，为后续的实时遥测分析奠定了坚实基础。

解决学术问题

该数据集有效解决了计算机视觉领域中的特定现实世界应用问题，特别是在低分辨率、动态背景下的数字识别任务。它弥补了传统手写数字数据集如MNIST在真实场景适应性上的不足，通过引入多源赛车视频数据，促进了模型在跨域泛化、小样本学习以及实时处理效率方面的研究。其意义在于推动了从实验室环境到实际工业应用的过渡，为自动驾驶、运动分析等领域的视觉系统开发提供了可扩展的基准测试平台。

衍生相关工作

基于该数据集，衍生了一系列经典研究工作，主要集中在轻量级神经网络架构的优化与部署上。例如，开发了适用于嵌入式系统的小型CNN模型，并通过ONNX格式实现高效推理，支持在mpv播放器的Lua脚本环境中进行实时齿轮检测。此外，相关研究还探索了数据增强策略对模型泛化能力的影响，以及多源数据融合技术，为其他运动分析或工业视觉任务提供了可借鉴的方法论框架。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集