DriveIndia

Name: DriveIndia
Creator: 印度海德拉巴技术学院
Published: 2025-07-30 02:59:59
License: 暂无描述

arXiv2025-07-30 更新2025-07-30 收录

下载链接：

https://tihan.iith.ac.in/tiand-datasets/

下载链接

链接失效反馈

官方服务：

资源简介：

DriveIndia是一个大规模的目标检测数据集，专门构建用于捕捉印度交通环境的复杂性和不可预测性。数据集包含66,986张高分辨率图像，以YOLO格式标注，跨越24个与交通相关的对象类别，包括各种天气条件（雾、雨）、光照变化、异构道路基础设施和密集、混合的交通模式，收集时间超过120小时，覆盖3,400多公里，包括城市、农村和高速公路路线。DriveIndia为现实世界的自动驾驶挑战提供了全面的基准。我们使用最先进的YOLO系列模型提供了基线结果，表现最好的变体实现了78.7%的mAP50。DriveIndia旨在支持在不确定的道路条件下进行鲁棒、可泛化的目标检测研究，将通过TiHAN-IIT Hyderabad数据集存储库公开提供。

DriveIndia is a large-scale object detection dataset specifically constructed to capture the complexity and unpredictability of the Indian traffic environment. The dataset contains 66,986 high-resolution images annotated in YOLO format, spanning 24 traffic-related object categories. It covers diverse weather conditions including fog and rain, illumination variations, heterogeneous road infrastructures, and dense, mixed traffic patterns. The data was collected over 120 hours across more than 3,400 kilometers, encompassing urban, rural, and highway routes. DriveIndia provides a comprehensive benchmark for real-world autonomous driving challenges. We have provided baseline results using state-of-the-art YOLO-series models, with the best-performing variant achieving a 78.7% mAP50. DriveIndia aims to support robust and generalizable object detection research under uncertain road conditions, and will be publicly available via the TiHAN-IIT Hyderabad dataset repository.

提供机构：

印度海德拉巴技术学院

创建时间：

2025-07-26

搜集汇总

数据集介绍

构建方式

DriveIndia数据集的构建基于对印度多样化交通场景的系统性采集，通过车辆搭载的高分辨率摄像头在超过120小时的行驶中捕获了66,986张图像，覆盖3,400多公里的城市、乡村和高速公路路段。数据采集策略特别注重环境多样性，包含了雾、雨等恶劣天气条件以及不同光照场景。所有图像均以1920×1080分辨率保存，并采用YOLO格式进行标注，每个对象的边界框信息存储在对应的.txt文件中。标注过程采用LabelImg工具结合自定义验证脚本，通过两阶段人工核查确保标注质量，最终形成包含24个交通相关对象类别的标准化数据集。

特点

DriveIndia数据集的核心特点体现在其对印度非结构化交通场景的全面覆盖。相较于主流国际数据集，该数据集独特收录了具有地域特色的对象类别，如机动三轮车、推车等，并包含大量在恶劣天气条件下的场景数据。数据分布呈现真实世界的长尾特性，常见车辆类别样本丰富，而救护车、警察车辆等安全关键类别样本相对稀缺。图像内容展现了印度交通特有的混行特征，包括异质车辆、行人、动物及不完善的道路基础设施，为开发具有强泛化能力的感知模型提供了重要素材。数据集的标注质量经过严格把控，采用紧致边界框策略，并对模糊或严重遮挡对象实施选择性标注，确保训练数据的可靠性。

使用方法

该数据集采用标准的训练-验证-测试划分（53,586/6,700/6,700），其目录结构兼容主流目标检测框架。研究人员可直接加载YOLO格式的标注文件进行模型训练，配套提供的基准测试结果包含YOLO系列和Transformer架构的多个先进模型性能指标。针对数据的长尾分布特性，建议采用过采样或损失加权等方法优化稀有类别的检测效果。数据集特别适用于研究复杂光照变化、部分遮挡及小目标检测等挑战性场景，通过TiHAN-IIT Hyderabad数据门户获取的完整套件包含图像数据、标注文件及预处理脚本，支持端到端的实验复现与比较研究。

背景与挑战

背景概述

DriveIndia数据集由IIT Hyderabad的研究团队于2025年推出，旨在解决自动驾驶系统在印度复杂交通环境中的感知挑战。作为目前印度最大的公开目标检测数据集，其包含66,986张高分辨率图像，涵盖24类交通相关对象，特别关注了多雾、降雨等恶劣天气条件以及非结构化道路场景。该数据集填补了现有国际基准（如KITTI、nuScenes）在发展中国家交通场景表征方面的空白，并为YOLO系列模型提供了78.7% mAP50的基准性能，显著推动了面向不确定环境的鲁棒性视觉感知研究。

当前挑战

DriveIndia面临双重挑战：在领域层面，需解决印度特有的非结构化交通问题，包括异质车辆混行、缺失车道标记、突发性道路异常等复杂场景，现有模型对救护车、未标记减速带等长尾类别检测精度不足（mAP50最低仅0.391）；在构建层面，数据采集需克服极端天气干扰，标注过程严格遵循50%可见度阈值和拉普拉斯方差质量控制，同时平衡24个类别在城乡道路的分布差异，这对标注一致性与数据代表性提出极高要求。

常用场景

经典使用场景

DriveIndia数据集专为印度复杂多变的交通场景设计，涵盖了城市、乡村和高速公路等多种道路类型，以及雾、雨等恶劣天气条件。其经典使用场景包括自动驾驶系统中的实时目标检测，特别是在非结构化交通环境下，如混合交通流、无标记车道和多样化的道路使用者。数据集的高分辨率图像和详尽的标注为模型训练提供了丰富的数据支持，使其成为评估和提升目标检测算法在复杂环境中性能的理想基准。

实际应用

DriveIndia数据集在实际应用中具有广泛的价值。它可用于开发适用于印度及其他类似交通环境的先进驾驶辅助系统（ADAS）和自动驾驶技术。数据集的多样性和真实性使其成为测试和优化目标检测算法在实际道路条件下性能的重要工具。此外，数据集还可用于交通监控、智能交通管理系统以及道路基础设施的维护和规划，为提高道路安全和交通效率提供数据支持。

衍生相关工作

DriveIndia数据集的发布促进了多个相关研究领域的发展。基于该数据集，研究人员开发了针对非结构化交通环境的改进目标检测算法，如针对小目标和长尾类别的优化模型。此外，数据集还被用于研究多模态感知系统，结合视觉和其他传感器数据提升检测性能。DriveIndia还激发了关于域适应和泛化能力的研究，特别是在不同地理和气候条件下的模型表现。这些衍生工作进一步推动了自动驾驶和智能交通系统在复杂环境中的应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集