LiDARDustX
收藏arXiv2025-05-28 更新2025-05-30 收录
下载链接:
https://github.com/vincentweikey/LiDARDustX
下载链接
链接失效反馈官方服务:
资源简介:
LiDARDustX数据集是专门为高尘环境下的感知任务设计的,如采矿区域所遇到的环境。该数据集由六个不同类型的激光雷达传感器捕获的30,000个激光雷达帧组成,每个帧都伴随着3D边界框注释和点云语义分割。超过80%的数据集包含受灰尘影响的场景。该数据集旨在支持开发能够在灰尘条件下有效运行的可靠自动驾驶系统,从而将自动驾驶技术的应用扩展到更具挑战性和非结构化环境中。
The LiDARDustX dataset is specifically designed for perception tasks in high-dust environments, such as those encountered in mining areas. This dataset consists of 30,000 LiDAR frames captured by six different types of LiDAR sensors, with each frame accompanied by 3D bounding box annotations and point cloud semantic segmentation ground truths. Over 80% of the dataset consists of dust-affected scenes. The dataset aims to support the development of reliable autonomous driving systems that can operate effectively under dusty conditions, thereby expanding the application of autonomous driving technology to more challenging and unstructured environments.
提供机构:
无锡智能控制研究院,湖南大学,清华大学,西安交通大学利物浦大学
创建时间:
2025-05-28
原始信息汇总
LiDARDustX数据集概述
数据集简介
- 专为自动驾驶感知任务设计,特别针对尘土飞扬的非结构化道路环境(如矿场和沙石场)
- 包含30,000帧LiDAR数据
- 提供3D边界框标注和点云分割标签
下载方式
-
Google Cloud Drive
- 下载链接:https://drive.google.com/file/d/1BSfYe4uLqaeKZzg5SzKNpu34UAzx3Dqn/view?usp=drive_link
-
Hugging Face Datasets
- 下载链接:https://huggingface.co/datasets/Weichenfeng/LiDARDustX
数据结构
LiDARDustX/ ├── ls128 │ ├── sequence_xxx.bin │ ├── sequence_xxx.label │ ├── sequence_xxx.txt │ ├── ... ├── ls64 ├── ly150 ├── ly300 ├── m1 └── ouster
许可信息
- 采用开源许可证
- 仅限非商业性研究和开发用途
相关论文
- Chenfeng Wei, Qi Wu, Si Zuo, et al. "LiDARDustX: A LiDAR Dataset for Dusty Unstructured Road Environments." ICRA 2025.
搜集汇总
数据集介绍

构建方式
LiDARDustX数据集的构建依托于多传感器协同采集平台,在内蒙古、山西和甘肃等典型矿区环境进行系统性数据捕获。研究团队采用六种异构LiDAR传感器(包括LS128S2、CB64S1等)以10Hz频率同步采集,通过专业标定实现点云拼接,形成稠密三维场景表示。数据标注采用创新的多阶段半自动流程:先基于区域生长算法分离地面与非地面点云,再结合3D包围框引导的聚类方法进行粗标注,最后通过分割模型生成伪标签供人工校验,确保30,000帧点云数据中30万个标注框的几何精度与语义一致性。
特点
该数据集的核心价值体现在三方面:传感器多样性方面,集成六种不同工作原理的LiDAR设备,涵盖机械式、固态及混合固态类型,提供多视角、多精度的数据表征;场景特殊性方面,80%以上帧数包含真实矿区扬尘场景,完整记录工程爆破、车辆扬尘等典型粉尘干扰模式;标注丰富性方面,不仅包含14类物体的7自由度3D包围框标注,还提供16类语义分割标签及物体追踪ID,支持检测、分割与多任务学习的联合研究。与现有数据集相比,其粉尘场景覆盖率超出Waymo等城市数据集三个数量级。
使用方法
数据集采用70%-30%的标准划分比例,训练集包含126个序列,测试集54个序列均等包含粉尘/无尘场景。研究者可通过官方GitHub获取传感器标定参数、时间同步数据及标注文件。针对三维检测任务,建议采用nuScenes评估协议计算mAP指标,其中卡车使用0.7 IoU阈值,轿车与行人采用0.5阈值;语义分割任务推荐使用mIoU指标,特别需要注意长尾分布问题。基准测试表明,多任务模型LiSD在粉尘环境下表现最优(76.4% AP),其共享特征学习机制可有效缓解粉尘干扰。
背景与挑战
背景概述
LiDARDustX数据集由Wuxi Intelligent Control Research Institute、Hunan University等机构的研究团队于2025年提出,旨在填补自动驾驶领域在非结构化粉尘环境下的数据空白。该数据集聚焦矿区等高粉尘场景,包含六种LiDAR传感器采集的30,000帧点云数据,其中80%为粉尘干扰场景,并配备3D边界框标注与点云语义分割标签。相较于KITTI、nuScenes等传统城市道路数据集,LiDARDustX首次系统性地解决了粉尘对感知算法的影响评估问题,为自动驾驶在恶劣环境下的可靠性研究提供了关键基准。其多传感器配置与精细化标注体系,显著推动了非结构化场景下的三维感知技术发展。
当前挑战
LiDARDustX针对的领域核心挑战在于粉尘环境下点云感知的鲁棒性退化问题。实验表明,粉尘会导致3D检测模型平均精度下降9.9%-18.1%,其中车辆扬尘对目标朝向误差的影响尤为显著。数据集构建过程中面临双重挑战:在数据采集层面,需平衡矿区作业安全与多传感器同步校准的复杂性;在标注层面,粉尘与物体点云的交叉干扰迫使团队开发新型标注流程,结合区域生长算法与半自动伪标签修正来解决传统3D标注失效的问题。此外,数据的长尾分布(最稀缺类与最多类数量比达1:30)也对算法泛化性提出更高要求。
常用场景
经典使用场景
LiDARDustX数据集在自动驾驶领域的高粉尘非结构化道路环境中具有经典应用场景。该数据集通过六种不同类型的LiDAR传感器采集了30,000帧点云数据,其中80%以上为粉尘影响的场景,为粉尘环境下的感知任务提供了丰富的数据支持。这些数据不仅包含3D边界框标注,还具备点云语义分割标签,使得研究者能够在粉尘干扰条件下验证和改进目标检测与分割算法的鲁棒性。数据集特别适用于矿区等粉尘密集环境,填补了现有自动驾驶数据集在非结构化场景中的空白。
衍生相关工作
LiDARDustX数据集推动了多项粉尘环境感知的经典研究。基于该数据集,TransFusion-L提出了Transformer融合架构,在粉尘条件下将检测AP提升至75.7%;LiSD多任务模型通过层次化特征聚合,同步实现了91.5%的mIoU分割精度和76.4%的检测AP。数据集还促进了Cylinder3D等分割方法的改进,其在粉尘点云中的语义分割mIoU达到93.4%。这些工作显著提升了自动驾驶系统在极端环境下的感知能力,相关成果已应用于矿区自动驾驶系统的实际部署。
数据集最近研究
最新研究方向
随着自动驾驶技术在结构化环境中的快速发展,非结构化场景下的感知挑战逐渐成为研究热点。LiDARDustX数据集的推出填补了高粉尘环境下LiDAR感知数据集的空白,为矿山、沙场等恶劣工况下的自动驾驶算法验证提供了关键支持。近期研究主要聚焦于多模态传感器融合在粉尘环境中的鲁棒性提升,以及基于Transformer架构的3D检测模型在点云稀疏化条件下的性能优化。该数据集通过六种异构LiDAR的同步采集,为传感器差异性研究提供了独特平台,相关成果已应用于无人矿卡和沙漠巡逻车等实际场景。2024年CVPR会议中,基于LiDARDustX开展的粉尘物理建模与点云去噪联合学习成为新兴方向,其揭示的粉尘散射特性对毫米波雷达与LiDAR的前融合算法设计具有重要启示意义。
相关研究论文
- 1LiDARDustX: A LiDAR Dataset for Dusty Unstructured Road Environments无锡智能控制研究院,湖南大学,清华大学,西安交通大学利物浦大学 · 2025年
以上内容由遇见数据集搜集并总结生成



