georghess/pandaset
收藏Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/georghess/pandaset
下载链接
链接失效反馈官方服务:
资源简介:
PandaSet旨在促进和推动自动驾驶和机器学习的研究与发展。作为第一个开源数据集,PandaSet结合了Hesai的顶级LiDAR传感器和Scale AI的高质量数据标注。数据集包含了48,000张相机图像、16,000次LiDAR扫描、103个场景(每个场景持续8秒)、28个标注类别和37个语义分割标签。此外,数据集还提供了完整的传感器套件,包括1个机械LiDAR、1个固态LiDAR、6个相机和车载GPS/IMU。PandaSet的目标是推动自动驾驶和机器学习领域的研究和开发。
PandaSet旨在促进和推动自动驾驶和机器学习的研究与发展。作为第一个开源数据集,PandaSet结合了Hesai的顶级LiDAR传感器和Scale AI的高质量数据标注。数据集包含了48,000张相机图像、16,000次LiDAR扫描、103个场景(每个场景持续8秒)、28个标注类别和37个语义分割标签。此外,数据集还提供了完整的传感器套件,包括1个机械LiDAR、1个固态LiDAR、6个相机和车载GPS/IMU。PandaSet的目标是推动自动驾驶和机器学习领域的研究和开发。
提供机构:
georghess
原始信息汇总
PandaSet 数据集概述
数据集基本信息
- 许可证: CC-BY-4.0
- 任务类别:
- 物体检测
- 标签:
- 自动驾驶
- 3D 物体检测
- 语义分割
- 美观名称: PandaSet
- 大小类别: 10K<n<100K
数据集特点
- 图像数据: 48,000 张相机图像
- LiDAR数据: 16,000 次 LiDAR 扫描
- 场景数量: 103 个场景,每个场景时长 8 秒
- 标注类别: 28 个标注类别
- 语义分割标签: 37 个
- 传感器配置:
- 1x 机械 LiDAR
- 1x 固态 LiDAR
- 6x 相机
- 车载 GPS/IMU
数据集用途
- 促进自动驾驶和机器学习领域的研究与开发
- 结合 Hesai 的高级 LiDAR 传感器和 Scale AI 的高质量数据标注
数据采集技术
- 使用前向 LiDAR(PandarGT)和机械旋转 LiDAR(Pandar64)收集数据
- 数据标注采用 cuboid 和分割标注(Scale 3D Sensor Fusion Segmentation)
搜集汇总
数据集介绍

构建方式
PandaSet数据集的构建旨在推动自动驾驶与机器学习领域的研究与发展。该数据集首次公开,适用于学术与商业用途,结合了Hesai公司顶尖的LiDAR传感器与Scale AI的高质量数据标注。数据采集过程中,使用了前向视角的LiDAR(PandarGT)与机械旋转LiDAR(Pandar64),并进行了立方体与分割标注(Scale 3D Sensor Fusion Segmentation),确保了数据的多样性与精确性。
特点
PandaSet数据集具备丰富的特征,包括48,000张摄像头图像、16,000次LiDAR扫描、103个场景,每个场景持续8秒,涵盖28个标注类别和37个语义分割标签。此外,数据集还配备了完整的传感器套件,包括1个机械LiDAR、1个固态LiDAR、6个摄像头以及车载GPS/IMU,为自动驾驶研究提供了全面的数据支持。
使用方法
PandaSet数据集适用于多种自动驾驶任务,如目标检测和语义分割。研究者可以通过官方网页获取数据集,并使用提供的开发工具包(Dev-kit)进行数据处理与模型训练。数据集的多样性和高质量标注使其成为推动自动驾驶技术发展的理想选择,适用于学术研究与商业应用。
背景与挑战
背景概述
PandaSet数据集由Hesai和Scale AI联合发布,旨在推动自动驾驶与机器学习领域的研究与发展。作为首个面向学术与商业用途的开源数据集,PandaSet结合了Hesai顶尖的LiDAR传感器技术与Scale AI的高质量数据标注,提供了包括48,000张摄像头图像、16,000次LiDAR扫描以及103个场景的详细标注。该数据集不仅涵盖了28个目标检测类别和37个语义分割标签,还配备了完整的传感器套件,包括机械LiDAR、固态LiDAR以及6个摄像头和车载GPS/IMU系统。PandaSet的发布为自动驾驶领域的研究者提供了丰富的多模态数据资源,极大地促进了3D目标检测与语义分割技术的进步。
当前挑战
PandaSet数据集在构建过程中面临了多重挑战。首先,如何整合来自不同传感器的数据并确保其一致性是一个复杂的问题,尤其是机械LiDAR与固态LiDAR的扫描方式差异较大。其次,高质量的数据标注需要大量的人力和时间投入,尤其是在3D目标检测与语义分割任务中,标注的精确性直接影响到模型的训练效果。此外,数据集的规模与多样性也对存储、处理和分析提出了较高的要求,尤其是在自动驾驶场景中,如何确保数据的真实性和代表性是另一个关键挑战。
常用场景
经典使用场景
PandaSet数据集在自动驾驶领域中被广泛应用于3D目标检测和语义分割任务。其独特的传感器组合,包括机械旋转式LiDAR和固态LiDAR,以及高分辨率摄像头,为研究人员提供了丰富的多模态数据。这些数据不仅支持对车辆、行人等目标的精确检测,还为复杂场景下的语义分割提供了高质量的标注,从而推动了自动驾驶技术的研究与开发。
解决学术问题
PandaSet数据集通过提供高质量的多模态数据和详细的标注,解决了自动驾驶领域中3D目标检测和语义分割的关键学术问题。其数据集的多样性和精确性,使得研究人员能够更有效地训练和验证模型,从而提升了自动驾驶系统的感知能力和安全性。此外,PandaSet的开源特性也促进了学术界与工业界的合作,加速了自动驾驶技术的进步。
衍生相关工作
PandaSet数据集的发布激发了大量相关研究工作,特别是在多模态数据融合和自动驾驶感知技术方面。许多研究者基于PandaSet开发了新的3D目标检测算法和语义分割模型,进一步提升了自动驾驶系统的性能。此外,PandaSet还促进了多传感器数据融合技术的研究,推动了自动驾驶领域中传感器融合算法的发展,为未来的自动驾驶技术奠定了坚实的基础。
以上内容由遇见数据集搜集并总结生成



