five

PandaSet

收藏
arXiv2021-12-23 更新2024-06-21 收录
下载链接:
https://scale.com/open-datasets/pandaset
下载链接
链接失效反馈
官方服务:
资源简介:
PandaSet是由和赛科技有限公司创建的高精度自动驾驶传感器数据集,包含超过100个场景,每个场景8秒长,提供28种物体分类标签和37种语义分割标签。数据集通过360°机械旋转激光雷达、前向长距离激光雷达和6个摄像头收集,旨在支持自动驾驶技术中的3D感知技术发展。PandaSet覆盖了复杂的城市驾驶环境,包括交通、行人、建筑区域、山丘和不同光照条件,适用于解决自动驾驶中的感知问题,提高自动驾驶车辆的鲁棒性。

PandaSet is a high-precision autonomous driving sensor dataset developed by Hesai Technology Co., Ltd. It encompasses over 100 scenarios, each lasting 8 seconds, and provides 28 object classification labels and 37 semantic segmentation labels. The dataset is collected via a combination of 360° mechanical rotating LiDAR, forward long-range LiDAR, and six cameras, with the goal of supporting the advancement of 3D perception technologies in autonomous driving. PandaSet covers complex urban driving environments including traffic scenarios, pedestrians, built-up areas, hilly terrains, and varying lighting conditions, and is designed to address perception challenges in autonomous driving and enhance the robustness of autonomous vehicles.
提供机构:
和赛科技有限公司,中国
创建时间:
2021-12-23
搜集汇总
数据集介绍
main_image_url
构建方式
在自动驾驶领域,高质量多模态数据的获取是推动感知算法发展的关键。PandaSet的构建依托于一套完备的高精度传感器套件,包括一台360度机械旋转激光雷达、一台前向长距离激光雷达以及六台相机。数据采集于硅谷的复杂城市环境,通过触发板实现激光雷达与相机的时间同步,确保多传感器数据对齐。所有场景均经过精心筛选,涵盖昼夜不同光照条件、密集交通、行人及复杂地形,最终形成超过100段、每段8秒的序列,并基于像素级传感器融合技术进行标注。
特点
PandaSet的显著特点在于其传感器配置的先进性与标注的丰富性。作为首个同时包含机械旋转和前向激光雷达的开源数据集,它提供了高达300米的探测范围与360度全视角覆盖。数据集包含28类物体检测标注与37类点云语义分割标注,标注密度高于同类数据集,且涵盖如电动滑板车、动物等罕见对象类别。此外,所有标注均基于多传感器融合确保高精度,并附带包含物体姿态、可见性等属性的元数据,为复杂驾驶场景下的算法鲁棒性研究提供了宝贵资源。
使用方法
为促进自动驾驶感知研究,PandaSet提供了配套的开发工具包与基线模型。研究者可利用该数据集进行纯激光雷达3D物体检测、激光雷达-相机融合3D检测以及激光雷达点云分割等任务。数据以帧结构组织,每帧包含同步的点云与图像数据,并附有精确的时间戳与传感器标定参数。用户可依据提供的划分方式使用训练与测试集,或基于全局坐标系下的点云数据开发新算法。数据集的开放许可允许学术与商业用途,旨在降低研究门槛并推动安全自动驾驶技术的部署。
背景与挑战
背景概述
随着自动驾驶技术的迅猛发展,对高质量、大规模数据的需求日益迫切。2020年,由禾赛科技、Scale AI及清华大学等机构联合推出的PandaSet数据集应运而生,成为首个配备完整高精度传感器套件且具备免费商业许可的开源自动驾驶数据集。该数据集旨在解决三维感知算法训练中数据精度不足、标注质量不高以及场景多样性有限等核心问题,通过集成360度机械旋转激光雷达、前向长距激光雷达及六台相机,采集了超过100个场景、每段8秒的多模态数据,并提供28类物体检测与37类点云语义分割标注。PandaSet以其丰富的标注类别、长距探测能力及复杂城市场景覆盖,显著推动了自动驾驶感知模型的鲁棒性与泛化性能研究。
当前挑战
在自动驾驶感知领域,三维物体检测与点云分割面临长尾分布、遮挡处理及远距离小目标识别等固有挑战。PandaSet通过引入罕见物体类别(如电动滑板车、动物)及高达300米的标注范围,试图缓解真实驾驶场景中的长尾问题,但其标注密度与类别平衡仍需进一步优化。数据构建过程中,多传感器时空同步与标定精度成为关键难题,研究团队采用触发板协调激光雷达与相机曝光,并基于像素级融合技术提升标注准确性。此外,数据采集受限于地理范围与光照条件,夜间及极端天气场景的覆盖不足,可能影响模型在复杂环境下的泛化能力。
常用场景
经典使用场景
在自动驾驶感知算法研究中,PandaSet数据集凭借其多模态传感器配置和丰富的标注信息,成为评估三维物体检测与点云分割性能的经典基准。该数据集通过融合360度机械旋转激光雷达和前向长距离激光雷达,提供了覆盖广泛距离和复杂场景的点云数据,使得研究人员能够在统一的平台上测试算法在密集交通、夜间照明及罕见物体类别下的鲁棒性。其高精度的标注体系为模型训练提供了可靠的真值参考,推动了感知技术从理论到实践的跨越。
实际应用
在实际自动驾驶系统开发中,PandaSet数据集被广泛应用于感知模块的验证与优化。其涵盖的城市道路、丘陵地形及多变光照条件,模拟了L4/L5级别自动驾驶所需应对的复杂环境。工程师利用该数据集训练和测试三维物体检测、语义分割模型,以提升车辆对行人、车辆及交通标志的识别精度。此外,数据集中包含的施工区域、电动滑板车等罕见场景,有助于增强系统在边缘案例中的安全性,加速自动驾驶技术的商业化部署。
衍生相关工作
围绕PandaSet数据集,学术界衍生出一系列经典研究工作,主要集中在多传感器融合与长距离感知领域。例如,基于该数据集的基线实验验证了PV-RCNN、PointPainting等先进算法在双激光雷达配置下的性能表现。后续研究进一步探索了激光雷达与相机数据的时序对齐、运动补偿技术,以及针对罕见物体类别的细分检测模型。这些工作不仅拓展了三维感知的理论边界,也为开源自动驾驶生态提供了可复现的算法框架与评估标准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作