isp-uv-es/IPL-CARLA-dataset

Name: isp-uv-es/IPL-CARLA-dataset
Creator: isp-uv-es
Published: 2024-06-21 15:06:05
License: 暂无描述

Hugging Face2024-06-21 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/isp-uv-es/IPL-CARLA-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

IPL-CARLA数据集是通过CARLA模拟器生成的自动驾驶语义分割数据集。该数据集包含来自两个不同模拟城市的图像，涵盖了不同的天气（晴天、雾天和雨天）和时间（早晨、白天、日落和夜晚）条件。数据集包含20000张RGB渲染图像及其对应的地面真实分割掩码，分割掩码包含35个不同的类别，颜色信息在dataset_classes.txt文件中指定。图像和掩码的大小为800 x 600像素。由于存储空间限制，前10000张图像和掩码存储在images和labels文件夹中，后10000张存储在images_2和labels_2文件夹中。完整数据集的大小为54GB。

The IPL-CARLA dataset is an autonomous driving semantic segmentation dataset created with the CARLA (Cars Learning to Act) simulator. The dataset includes images generated from two different simulated cities, covering various weather (sunny, foggy, and rainy) and daytime (morning, day, sunset, and night) conditions. It contains 20,000 RGB-rendered images and their corresponding ground truth segmented masks, with 35 different classes indicated by colors in the dataset_classes.txt file. The images and masks have a size of 800 x 600 pixels. Due to space constraints, the first 10,000 images and masks are stored in the images and labels folders, while the last 10,000 are in the images_2 and labels_2 folders. The complete dataset has a size of 54 GB.

提供机构：

isp-uv-es

原始信息汇总

IPL-CARLA-dataset

数据集概述

名称: IPL-CARLA-dataset
任务类别: 图像分割
大小类别: n<1K
标签: 图像, 图像分割
标注创建者: CARLA模拟器
许可证: Apache 2.0

数据集信息

生成方式: 使用CARLA模拟器创建
图像来源: 来自两个不同的模拟城市
环境条件: 包含不同的天气（晴天、雾天和雨天）和白天时间（早晨、白天、日落和夜晚）条件
图像数量: 20000张RGB渲染图像
标注类型: 对应的分割掩码
标注类别: 35个不同的类别，颜色在dataset_classes.txt文件中指示
图像尺寸: 800 x 600像素

数据集结构

图像命名: rgb_{1,...20000}.png
标注命名: seg_{1,...,20000}.png
存储结构:
- 前10000张图像和标注存储在images和labels文件夹中
- 后10000张图像和标注存储在images_2和labels_2文件夹中
总大小: 54 Gb

搜集汇总

数据集介绍

构建方式

在自动驾驶语义分割研究领域，数据集的构建往往依赖于真实世界的采集，然而真实环境的数据获取成本高昂且难以覆盖多样化的场景。IPL-CARLA-dataset巧妙地运用了CARLA模拟器，通过虚拟环境生成图像数据。该数据集在模拟的两个不同城市中，系统性地采集了20000张RGB渲染图像及其对应的语义分割真值掩码。数据生成过程涵盖了多种天气条件（如晴朗、雾天、雨天）以及不同时间段（早晨、白天、日落、夜晚），确保了场景的多样性和复杂性。所有图像和掩码均统一为800x600像素的分辨率，并按照序号命名，便于后续处理与索引。

特点

该数据集的核心特点在于其高度可控的模拟环境与丰富的语义标注。通过CARLA模拟器生成的数据，不仅避免了真实数据采集中的安全与隐私问题，还实现了对天气、光照等环境因素的精确调控。数据集提供了35个不同的语义类别，覆盖了自动驾驶场景中常见的道路、车辆、行人、建筑等元素，每个类别在掩码中均有对应的颜色编码，详细记录于数据集附带的类别文件中。此外，数据规模达到54GB，分为两个子文件夹存储，确保了数据的完整性与可管理性，为模型训练提供了充足的样本支持。

使用方法

使用IPL-CARLA-dataset时，研究人员可将其直接应用于自动驾驶语义分割模型的训练与评估。数据集中的图像文件（如rgb_1.png）与对应的分割掩码文件（如seg_1.png）需配对使用，前者作为输入，后者作为监督信号。由于数据已按序号组织，用户可轻松构建数据加载管道，例如通过读取images和labels文件夹中的前10000个样本，以及images_2和labels_2文件夹中的后10000个样本。在预处理阶段，建议根据模型需求调整图像尺寸或进行归一化，同时参考dataset_classes.txt文件中的类别颜色映射，确保掩码解析的正确性。该数据集适用于PyTorch、TensorFlow等主流深度学习框架，助力于分割算法的性能验证与创新研究。

背景与挑战

背景概述

随着自动驾驶技术的迅猛发展，语义分割作为环境感知的核心任务，对高精度标注数据的需求日益迫切。IPL-CARLA-dataset由研究团队借助CARLA仿真平台于近年构建，旨在通过合成数据解决真实世界数据采集成本高昂、标注一致性难以保证的瓶颈。该数据集聚焦于复杂多变的驾驶场景，涵盖不同城市布局、天气条件与光照变化，共提供两万张图像及其对应的精细分割掩码，涉及35个语义类别，为自动驾驶系统的环境理解模型提供了丰富且可控的训练资源，显著推动了仿真数据在感知任务中的应用研究。

当前挑战

在自动驾驶语义分割领域，模型需在动态环境中准确识别多样化的物体与场景，IPL-CARLA-dataset针对仿真与真实域差异、光照与天气扰动下的分割鲁棒性等核心问题提出了挑战。构建过程中，数据生成面临仿真场景真实感不足、类别平衡与标注一致性维护等困难，同时大规模高分辨率图像存储与处理亦带来技术瓶颈。这些挑战促使研究者探索域适应方法与高效数据管理策略，以提升仿真数据在实际部署中的有效性。

常用场景

经典使用场景

在自动驾驶领域，语义分割技术是理解复杂驾驶环境的核心手段。IPL-CARLA-dataset通过CARLA仿真器生成，提供了涵盖多种天气与光照条件的合成图像及其分割掩码，成为训练和验证分割模型的经典资源。该数据集常用于开发能够精准识别道路、车辆、行人等35类关键元素的深度学习算法，为自动驾驶系统的环境感知模块奠定数据基础。

衍生相关工作

围绕该数据集，学术界衍生了一系列经典研究工作。例如，基于其多域特性，研究者提出了多种域泛化与自适应分割网络，以提升模型从仿真到真实世界的迁移能力。同时，该数据也被用于半监督与自监督学习框架的验证，推动了数据高效利用方法的发展，为自动驾驶感知技术的进步提供了持续动力。

数据集最近研究