synthetic-driver-monitoring-detection

Hugging Face2026-05-13 更新2026-05-15 收录

下载链接：

https://huggingface.co/datasets/anywaylabs/synthetic-driver-monitoring-detection

下载链接

链接失效反馈

官方服务：

资源简介：

Synthetic DMS（驾驶员监控系统）数据集是一个由AnywayLabs.ai生成的完全合成图像数据集，专门用于驾驶员监控和分心检测任务。该数据集旨在为汽车环境中的驾驶员风险行为检测模型提供训练数据，采用有监督目标检测的范式。数据集包含1,356张带标注的训练图像，覆盖四种驾驶员分心行为类别（如饮水、打哈欠、打电话、发短信等），并提供了多个摄像头视角（FOV1, FOV2, FOV3及其变体）。图像分辨率为1376×768，标注采用YOLO格式（归一化边界框）。数据集通过专有的合成生成框架创建，能够对行为类型、驾驶员姿势、遮挡情况、光照条件和车内背景等进行可控变化，旨在扩展行为分布、引入受控的外观变化，从而提高模型对未见真实世界驾驶员行为的鲁棒性。该数据集适用于驾驶员分心检测模型训练、在真实舱内数据微调前的合成预训练、汽车安全系统开发以及多视角行为识别研究。与真实世界驾驶员监控数据集相比，本数据集无隐私顾虑、标注成本低、行为覆盖可配置且类别平衡可控。

The Synthetic DMS (Driver Monitoring System) dataset is a fully synthetic image dataset generated by AnywayLabs.ai, specifically designed for driver monitoring and distraction detection tasks. It aims to provide training data for models detecting driver risk behaviors in automotive environments, following a supervised object detection paradigm. The dataset includes 1,356 annotated training images covering four driver distraction behavior categories (such as drinking, yawning, calling, texting, etc.), and offers multiple camera perspectives (FOV1, FOV2, FOV3, and their variants). The image resolution is 1376×768, with annotations in YOLO format (normalized bounding boxes). Created through a proprietary synthetic generation framework, it allows controlled variations in behavior types, driver postures, occlusion conditions, lighting conditions, and in-car backgrounds, aiming to expand behavior distributions and introduce controlled appearance variations, thereby enhancing model robustness to unseen real-world driver behaviors. This dataset is suitable for training driver distraction detection models, synthetic pre-training before fine-tuning on real in-cabin data, automotive safety system development, and multi-view behavior recognition research. Compared to real-world driver monitoring datasets, it has no privacy concerns, low annotation costs, configurable behavior coverage, and controllable class balance.

创建时间：

2026-05-05

搜集汇总

数据集介绍

构建方式

Synthetic Driver Monitoring Detection数据集由AnywayLabs.ai基于其专有的合成数据生成框架构建。该框架能够对驾驶员行为层级（如饮水、打哈欠、打电话、发短信等动作类型）和场景层级（包括光照条件、车内背景变化及摄像头视角位置）进行精细化控制。标注过程采用YOLO格式，为每个行为实例生成归一化的边界框，并通过人工审核确保标注的紧致性与一致性。数据集包含三个不同视角（FOV1、FOV2、FOV3）的驾驶舱图像，共计1,356张训练样本，每张图像分辨率统一为1376×768像素。

特点

该数据集的核心特点在于其完全合成的数据生成方式，有效规避了真实驾驶员监控数据集中常见的隐私问题与高昂的人工标注成本。数据集覆盖了四种典型的驾驶员分心行为类别，并通过可配置的行为分布与场景变化，显著扩展了训练数据的多样性。其结构化的控制能力使得研究者能够引入遮挡、部分可见性及姿态变化的复杂情况，从而提升模型对未知真实驾驶行为的泛化鲁棒性。此外，数据集支持多视角图像输入，为多视角行为识别研究提供了理想的实验基础。

使用方法

该数据集专门用于监督式目标检测任务，推荐采用Ultralytics YOLO框架进行模型训练，也可经格式转换后适配Detectron2等兼容YOLO格式的流水线。使用时，可将标注目录与图像目录对应加载，并依据data.yaml配置文件定义类别及路径。数据集特别适用于驾驶员分心检测模型的预训练，或在真实车内数据上进行微调前的合成数据热身训练。由于未公开验证集，建议用户自行划分训练与验证子集，并注意不同摄像头视角与光照条件下的性能差异。

背景与挑战

背景概述

该数据集由AnywayLabs.ai于近期创建，聚焦于驾驶员行为监控与分心检测的监督式目标检测任务。在自动驾驶与高级驾驶辅助系统快速发展的背景下，车内驾驶员状态监测成为提升行车安全的关键环节。该数据集通过全合成图像生成技术，模拟了多种视角（FOV1、FOV2、FOV3）下的驾驶员分心行为，涵盖打电话、发短信、喝水、打哈欠四类动作，旨在为汽车安全系统提供高泛化能力的训练基础。其合成方式规避了真实数据采集中的隐私问题与标注成本，并允许对行为分布与场景变量进行精准控制，对推动合成数据在车载视觉领域的应用具有重要意义。

当前挑战

领域问题层面，传统真实驾驶员监测数据集受限于采集场景、隐私法规及行为分布不均衡，难以覆盖复杂驾驶环境中的危险行为多样性，导致模型泛化能力不足。构建过程中，该数据集需应对合成图像与真实车内场景间的域差异，包括光照、内饰纹理及摄像头视角的逼真度平衡，以及确保合成动作的物理合理性与标注精度。此外，数据集规模较小（仅1356张训练图像），且未提供验证集，可能影响模型训练的稳定性和性能评估的全面性，尤其在多视角融合与细粒度行为识别任务中面临挑战。

常用场景

经典使用场景

在智能驾驶辅助系统与行车安全研究领域，synthetic-driver-monitoring-detection数据集为驾驶员行为监控与分心检测任务提供了标准化的训练资源。该数据集汇集了涵盖四种分心行为类别的全合成图像，并包含多个摄像头视角（FOV1、FOV2、FOV3等），使得研究者能够基于统一的YOLO格式标注进行监督式目标检测模型训练。其经典的使用范式是利用合成图像中丰富的行为姿态与环境变化，训练出能够从单帧图像中精准定位并识别驾驶员分心行为（如打电话、喝水、发短信、打哈欠）的检测器。该数据集因其高质量的渲染与可控的行为分布，尤其适合作为迁移学习的预训练数据，或在真实车内场景数据不足时作为模型初始化的基础。此外，数据集自带的多种视野配置支持研究者开展多视角融合与视角鲁棒性分析，为构建高可靠性的驾驶舱感知系统奠定了坚实基础。

实际应用

在自动驾驶与高级驾驶辅助系统的工程实践中，synthetic-driver-monitoring-detection数据集展现出显著的应用潜力。一方面，它可直接用于训练部署于车载摄像头上的驾驶员分心检测模型，使系统能够实时识别并预警驾驶员的不安全行为，从而降低由分心驾驶引发的交通事故风险。另一方面，该数据集因其灵活的合成参数调节机制，特别适合作为真实场景数据的补充，通过微调策略显著提升模型在特定车型、光线条件或座椅位置下的检测精度。各类自动驾驶与车控平台（如基于Ultralytics YOLO框架）可以快速集成该数据集，实现从模型训练到边缘端部署的全流程闭环。此外，该数据集还支持多视角行为识别与座舱内环境理解功能的研发，在网约车安全管理、驾驶员疲劳预警系统以及共享汽车智能监控等商业场景中具有广泛的转化价值。

衍生相关工作

基于synthetic-driver-monitoring-detection数据集，研究者已拓展出一系列富有影响力的衍生工作。在数据增强方向，该数据集被用作合成到真实域迁移学习的基准，推动了风格迁移与域自适应算法在驾驶舱环境中的创新应用。在模型架构层面，该数据集催生了针对多视角融合检测的轻量化网络设计，以及结合注意力机制的分心行为时空特征提取方法。此外，部分工作以此数据集为起点，构建了包含更多行为细粒度类别（如手持物品高度、视线方位）的扩充合成数据集，从而进一步丰富了驾驶员状态感知的研究维度。该数据集还启发了若干面向合成数据质量评估与标签噪声分析的方法学探讨，为后续大规模合成数据集在安全关键系统中的可信使用提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集