Flash LiDAR Vehicle Detection Dataset

github2026-04-08 更新2026-04-25 收录

下载链接：

https://github.com/mathworks/Flash-LiDAR-Vehicle-Detection-with-MATLAB-Dataset-and-Deep-Learning-Benchmarks

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集专为使用Flash LiDAR传感器进行车辆检测算法基准测试而收集，属于公共领域。数据集包含35个序列，涵盖八种不同的车辆，包括七种四轮车辆和一个小型飞机。每个序列使用128x128 Flash LiDAR传感器捕获，记录每个检测点的距离和强度信息。数据集提供四种不同格式以支持各种深度学习模型：2D图像格式、点云格式、多通道图像格式和原始格式。所有数据都经过去噪处理，并通过去除超出标准偏差第99百分位的点来优化，数值经过归一化和缩放以最大化每种格式的细节。

This dataset was collected specifically for benchmarking vehicle detection algorithms using Flash LiDAR sensors, and it is in the public domain. The dataset contains 35 sequences, covering eight distinct vehicle types including seven four-wheeled vehicles and one small aircraft. Each sequence was captured using a 128×128 Flash LiDAR sensor, which records the distance and intensity information for each detected point. The dataset provides four different formats to support various deep learning models: 2D image format, point cloud format, multi-channel image format, and raw format. All data has been denoised, optimized by removing points beyond the 99th percentile of the standard deviation, and normalized and scaled to maximize the detail retention of each format.

创建时间：

2026-04-04

原始信息汇总

数据集概述：Flash LiDAR 车辆检测数据集

该数据集专为使用 Flash LiDAR 传感器进行车辆检测的深度学习算法基准测试而收集。数据集为公共领域（Public Domain）数据，包含 35 个序列，涉及八种不同的车辆（包括七辆四轮车辆和一架小型飞机）。每个序列均由 128x128 的 Flash LiDAR 传感器捕获，记录了每个检测点的距离和强度信息。

数据格式

数据集提供四种不同的格式，以支持多种深度学习模型：

2D 图像格式：每个图像为 uint16 的 3 通道图像，距离数据映射到“红色”通道，强度数据映射到“蓝色”通道。推荐用于测试 YOLOX 等 2D 目标检测模型。包含真实标注：边界框和分割掩码。
点云格式：数据以 PCD 文件形式提供，保留每个点的空间位置和强度。适用于 RandLA-Net 等 3D 检测与分割模型。包含真实标注：立方体和分割掩码。
多通道图像格式：每个 128x128 图像包含五个通道：X、Y、Z、距离和强度。用于 SalsaNext 等多通道模型。包含真实标注：边界框、立方体和分割掩码。
原始格式：每个序列包含两个 128x128xnFrames 的数组，分别代表传感器直接记录的未滤波、未处理的距离和强度。包含真实标注：边界框、立方体和分割掩码。

所有数据均已通过去除标准差第 99 百分位数以外的点进行去噪，并对数值进行归一化和缩放，以最大化各格式的细节（例如，将 uint16 值拉伸至 0 到 2^16 的完整范围）。

数据下载链接

2D 数据 (PNG 图像 + 边界框 + 掩码标注)：下载 2D 数据
3D 数据 (PCD 点云 + 立方体 + 掩码标注)：下载 3D 数据
5 通道数据 (MAT 5 通道图像 [x, y, z, range, intensity] + 边界框 + 立方体 + 掩码标注)：下载 5 通道数据
原始数据 (MAT 数组 [range, intensity] + 边界框 + 立方体 + 掩码标注)：下载原始数据

注意：数据集体积较大，下载可能需要几分钟到数小时不等，具体取决于网速。

环境要求

MATLAB (R2024A 或更新版本)
所需工具箱：
- Deep Learning Toolbox™
- Computer Vision Toolbox™
- Lidar Toolbox™
- Automated Visual Inspection Library™
- Parallel Computing Toolbox™ (推荐)
硬件建议：运行和训练深度学习模型建议使用配备专用 GPU 的计算机。

许可信息

脚本的许可信息见仓库中的 License.txt 文件。
数据集的许可信息包含在可下载的压缩文件夹中，内有单独的 License.txt 文件。

搜集汇总

数据集介绍

构建方式

该数据集专为基于Flash LiDAR传感器的车辆检测算法基准测试而构建，采集自35个序列，涵盖八种不同车辆（含七种四轮车辆及一架小型飞机）。每个序列由128×128分辨率的Flash LiDAR传感器捕获，记录每个探测点的距离与强度信息。数据经过去噪处理，移除超过标准差99百分位数的点云，并将数值归一化缩放至各格式的完整动态范围（如uint16值拉伸至0–2¹⁶区间）。数据集以四种格式发布：二维图像格式将距离与强度映射至红蓝通道；点云格式保留空间位置与强度；多通道图像格式包含X、Y、Z、距离和强度五个通道；原始格式直接提供未经滤波的距离与强度阵列。

特点

数据集的显著特点在于其多模态格式设计，可无缝适配不同深度学习模型需求，涵盖二维目标检测（如YOLOX）、三维分割（如RandLA-Net）及多通道语义分割（如SalsaNext）。每种格式均配套完整标注，包括二维边界框与分割掩膜、三维立方体与点云分割掩膜，确保训练与评估的精确性。所有数据源自同一Flash LiDAR传感器，保证跨格式的一致性，同时通过标准化预处理提升数据质量。数据集规模庞大，压缩包下载耗时数分钟至数小时，体现了其覆盖场景的全面性与丰富性。

使用方法

使用者需首先根据所需模型选择对应格式的数据集进行下载，例如二维图像格式用于YOLOX、五通道格式用于SalsaNext、点云格式用于RandLA-Net。随后克隆本仓库并在MATLAB®中打开，将解压后的数据存放至“Data”目录下。安装必要的MATLAB产品（包括Deep Learning Toolbox、Lidar Toolbox等）及对应深度学习模型的支持包后，即可运行各模型目录下的示例脚本进行训练或测试。建议使用配备专用GPU的计算机以加速模型运行。预处理脚本目录提供了原始数据转换为其他格式的参考代码，便于用户自定义数据处理流程。

背景与挑战

背景概述

闪光激光雷达（Flash LiDAR）作为一种固态激光雷达技术，凭借其单次快照即可获取完整场景深度与强度信息的优势，在自动驾驶感知领域日益受到重视。然而，现有公开数据集多集中于机械旋转式激光雷达，针对闪光激光雷达的专用车辆检测基准数据集仍较为稀缺。该数据集由MathWorks团队于2025年创建，旨在弥补这一空白，其核心研究问题在于系统评估和比较不同深度学习模型（如YOLOX、SalsaNext、RandLA-Net）在闪光激光雷达数据上的车辆检测性能。数据集包含35个序列，涵盖八种不同类型车辆（包括小型飞机），并以2D图像、3D点云、多通道图像及原始数据四种格式提供，支持跨维度的算法评测。这一资源的发布为闪光激光雷达在自动驾驶中的工程应用提供了标准化的评估基准。

当前挑战

领域挑战方面，闪光激光雷达面临的感知难题包括：传感器分辨率有限（128x128），导致远距离或小目标车辆的特征稀疏；环境光照与天气条件对强度测量值的干扰，易引发误检与漏检；以及车辆姿态多样性（如不同视角下的三维形变）对检测模型泛化能力提出的严苛要求。构建过程中的挑战亦不容忽视：原始数据采集时需处理超过99%分位标准差的高斯噪声，涉及复杂的去噪与归一化流程；多格式数据（2D/3D/多通道/原始）的同步标注极为繁琐，需手动为每帧生成边界框、三维立方体及语义掩码；此外，数据集的存储与分发因体积庞大（单序列即含数千帧）而面临传输效率与结构一致性维护的难题。

常用场景

经典使用场景

在自动驾驶环境感知领域，该数据集主要用于多模态车辆检测算法的性能基准测试。研究者可将Flash LiDAR采集的128x128分辨率数据，分别以2D图像、3D点云、五通道特征图像及原始阵列四种格式输入至YOLOX、SalsaNext、RandLA-Net等主流深度学习模型，通过统一的包围框、立方体与分割掩码标签，系统性比较不同架构在稀疏闪光激光雷达数据上的检测精度与计算效率。这种多格式兼容的基准框架，使得研究者能够针对性地评估2D目标检测、3D语义分割以及多通道特征融合方法在复杂交通场景下的适应性。

衍生相关工作

该数据集催生了多个方向上的衍生研究。在算法层面，研究者基于其2D图像格式开发了针对闪光激光雷达的轻量化YOLOX变体，通过通道注意力机制增强对强度信息的感知；利用五通道数据，SalsaNext的改进版本探索了跨模态特征蒸馏方法以提升小目标分割精度。在工具链层面，MATLAB社区围绕该数据集构建了包括点云滤波、坐标系转换、自动化标注在内的预处理工具箱，并衍生出针对128x128分辨率优化的数据增强策略。其公开的基准测试结果亦被用于验证新型评价指标（如稀缺点云下的联合交集比修正因子），形成了感知算法比较的公共规范，持续推动着固态激光雷达自动驾驶专有模型的进化。

数据集最近研究