comma2k19
收藏arXiv2018-12-14 更新2024-06-21 收录
下载链接:
https://github.com/commaai/comma2k19
下载链接
链接失效反馈官方服务:
资源简介:
comma2k19数据集由comma.ai创建,包含2019个1分钟长的视频片段,总计超过33小时的高速公路驾驶数据。数据集通过comma EON设备收集,包含多种传感器数据,如摄像头、GPS、温度计和IMU等。这些数据集中在一个20公里的加州高速公路上,旨在通过使用普通传感器来开发和验证紧密耦合的GNSS算法和地图算法。数据集特别适用于开发高性能的定位和地图算法,这些算法旨在在普通硬件上运行,解决自动驾驶等领域的问题。
The comma2k19 dataset, created by comma.ai, comprises 2019 one-minute video clips, totaling over 33 hours of highway driving footage. Collected via comma EON devices, the dataset encompasses diverse sensor data including cameras, GPS receivers, thermometers, and inertial measurement units (IMUs), among others. All data was gathered along a 20-kilometer stretch of highway in California. Its core objective is to develop and validate tightly coupled GNSS algorithms and mapping algorithms using commodity off-the-shelf sensors. This dataset is particularly well-suited for developing high-performance positioning and mapping algorithms designed to run on standard hardware to address challenges in domains such as autonomous driving.
提供机构:
comma.ai
创建时间:
2018-12-14
搜集汇总
数据集介绍

构建方式
在自动驾驶与高精度地图构建领域,数据采集的规模与质量直接影响算法性能。comma2k19数据集的构建聚焦于可扩展性与实用性,通过搭载消费级传感器的设备在加州280号高速公路一段20公里路段上,采集了总计33小时的通勤驾驶数据。数据采集依托comma EON设备,其集成了道路面向摄像头、9轴惯性测量单元、温度计及手机GPS等常见智能手机传感器,并配合comma grey panda捕获车辆CAN总线数据与原始全球导航卫星系统测量值。数据以每分钟为一段进行切分,形成2019个连续片段,确保了时间与空间上的高密度覆盖。
特点
该数据集的核心特点在于其传感器配置与数据处理的先进性。它首次大规模公开了原始GNSS测量数据,包括多普勒频移、伪距与载波相位,为紧耦合算法开发提供了珍贵输入。同时,数据集附带了由紧耦合GNSS/INS/视觉优化器计算得到的全局位姿估计,其位置与姿态均以地球中心地球固定坐标系表示,并经过开源库Laika处理,定位精度较原始模块提升40%。数据高度集中于单一路段,实现了多时段、多天气条件下的重复观测,这对特征稀疏的高速公路场景下的地图构建与定位研究具有独特价值。
使用方法
comma2k19数据集主要服务于紧耦合GNSS算法、多传感器融合位姿估计及高精度地图构建的研究。使用者可基于其提供的原始传感器流——包括摄像头图像、IMU数据、CAN消息及原始GNSS测量值,开发或验证融合优化模型。数据集附带的全局位姿可作为算法评估的参考基准,尤其适用于检验在消费级硬件上运行的定位与建图系统的性能。研究人员还可利用Laika库处理原始GNSS数据,对比不同解算策略的精度,或结合视觉特征进行跨时段的地图优化与精细化位姿校正。
背景与挑战
背景概述
在自动驾驶与高精度地图构建领域,数据集的构建对于推动算法创新具有关键作用。comma2k19数据集由comma.ai团队于2018年发布,旨在通过消费级传感器采集高密度、可扩展的驾驶数据,以支持紧耦合GNSS算法与地图构建算法的研发。该数据集聚焦于加州280号高速公路一段20公里的通勤路段,累计记录超过33小时的驾驶数据,涵盖摄像头、IMU、原始GNSS测量及车辆CAN消息等多模态信息。其核心研究问题在于利用廉价传感器实现高精度全局位姿估计,为自动驾驶系统中的定位与地图构建提供了重要基准,推动了紧耦合传感器融合技术的发展。
当前挑战
comma2k19数据集致力于解决自动驾驶领域中基于消费级传感器的高精度定位与地图构建问题,其挑战在于如何在有限硬件条件下实现紧耦合GNSS/INS/视觉融合,以提升全局位姿估计的鲁棒性与准确性。构建过程中的挑战包括:在高速公路场景下视觉特征稀疏,导致传统视觉跟踪算法性能受限;原始GNSS数据受天线位置与信号干扰影响,需通过后处理库(如Laika)优化以提升定位精度;多传感器数据同步与标定复杂度高,且需在密集重复观测中确保数据一致性以支持地图构建算法的验证。
常用场景
经典使用场景
在自动驾驶与高精度定位领域,comma2k19数据集以其密集的公路驾驶数据成为紧耦合GNSS算法开发的理想测试平台。该数据集聚焦于加州280号高速公路的日常通勤场景,通过消费级传感器采集了超过33小时的连续驾驶记录,包括摄像头、IMU、CAN总线及原始GNSS测量数据。这种设计使得研究者能够在真实的高速公路环境中,针对稀疏视觉特征的路况,验证和优化紧耦合GNSS/INS/视觉融合算法,从而推动基于低成本硬件的定位与建图技术发展。
解决学术问题
comma2k19数据集主要解决了在消费级传感器条件下实现高精度全局位姿估计的学术挑战。传统方法多采用松耦合方式融合GNSS模块的预计算导航解,而该数据集提供的原始GNSS测量数据使得紧耦合算法成为可能,显著提升了定位精度。通过引入开源GNSS处理库Laika,研究者在处理原始数据时能够将位置误差降低40%,这为在有限硬件资源下实现鲁棒的自动驾驶定位系统提供了关键数据支撑,推动了紧耦合多传感器融合理论在实践中的深化与应用。
衍生相关工作
基于comma2k19数据集,研究者衍生出了一系列经典工作,尤其在紧耦合多传感器融合与开源工具开发方面成果显著。其中,开源GNSS处理库Laika的推出,为原始GNSS数据的高效处理设立了新基准,促进了后续如RTKLIB等工具的集成与优化。此外,该数据集还激发了多状态约束卡尔曼滤波(MSCKF)在视觉-惯性-GNSS紧耦合中的应用研究,推动了如Mesh3D等后处理框架的发展,为高精度地图构建与自动驾驶定位算法的开源生态贡献了核心数据与算法基础。
以上内容由遇见数据集搜集并总结生成



