nuScenes and Argoverse 2
收藏github2024-05-20 更新2024-05-31 收录
下载链接:
https://github.com/LiljaAdam/geographical-splits
下载链接
链接失效反馈官方服务:
资源简介:
该仓库主要处理nuScenes和Argoverse 2两个数据集,通过地理位置对这些数据集进行分割,以解决在线映射数据集中的数据泄露问题。
This repository primarily handles the nuScenes and Argoverse 2 datasets, segmenting these datasets based on geographical locations to address data leakage issues in online mapping datasets.
创建时间:
2023-12-01
原始信息汇总
数据集概述
数据集名称
- Localization Is All You Evaluate
数据集描述
- 该数据集用于解决在线地图数据集中的数据泄露问题,特别是在nuScenes和Argoverse 2数据集中,训练、验证和测试集在地理上重叠导致性能评估不准确的问题。
数据集内容
- 提供了nuScenes和Argoverse 2数据集的地理隔离分割(Geographically Disjoint splits),包括Near Extrapolation和Far Extrapolation分割。
- 包含用于生成这些分割的代码和示例,以及如何将现有在线地图方法的原始分割文件转换为地理隔离分割文件的指南。
数据集结构
- nuScenes Near Extrapolation Splits
- 包含波士顿、新加坡等地的地图分割示例。
- Argoverse 2 Near Extrapolation Splits
- 包含多个城市的地图分割示例。
数据集使用
- 用户可以直接使用这些分割来训练和评估在线地图方法的性能。
- 地理隔离分割定义在txt文件中,也提供了pkl文件以方便使用。
数据集验证
- 提供了验证地理隔离分割的代码和步骤,包括数据下载、分割生成和原始pkl文件转换为地理隔离分割pkl文件的方法。
数据集相关链接
- 论文链接:arXiv
数据集版本
- 对于nuScenes Near Extrapolation splits,提供了两种版本:
- 使用所有样本,边界上的序列被分割并分配到相应的集合。
- 移除了跨越集合边界的序列。
搜集汇总
数据集介绍

构建方式
nuScenes和Argoverse 2数据集的构建方式主要基于地理空间的分区。研究者提出了一种地理上不相交的分割方法,即将训练集、验证集和测试集中的样本根据其地理位置进行划分,确保不同集合中的样本在地理上不重叠。具体而言,nuScenes和Argoverse 2数据集中的样本被分为近外推和远外推两类,分别对应于不同地理范围的分割。通过这种方式,研究者旨在减少数据泄露问题,从而更准确地评估在线地图构建方法的性能。
使用方法
使用该数据集时,用户可以直接利用提供的近外推和远外推分割文件进行训练和评估。数据集提供了txt和pkl格式的文件,用户可以根据需要选择合适的格式。此外,数据集还提供了代码示例,帮助用户将现有的在线地图构建方法的pkl文件转换为地理上不相交的分割文件。用户可以通过运行提供的Python脚本生成所需的分割文件,并根据相关文档进行训练和评估。
背景与挑战
背景概述
nuScenes和Argoverse 2数据集是当前在线地图构建领域的顶尖数据集,主要用于监督学习方法的训练与评估。这两个数据集由nuScenes和Argoverse 2项目分别发布,涵盖了多个地理区域的丰富数据,旨在推动自动驾驶和在线地图构建技术的发展。其核心研究问题在于如何有效评估和提升在线地图构建方法的性能,尤其是在地理定位方面的准确性。通过这些数据集,研究人员能够更好地理解和优化现有的在线地图构建算法,从而对自动驾驶和智能交通系统产生深远影响。
当前挑战
nuScenes和Argoverse 2数据集在构建和使用过程中面临的主要挑战包括:首先,数据集中训练、验证和测试集的地理位置重叠问题,导致性能评估结果的偏差。具体而言,nuScenes数据集中超过80%的验证和测试样本与训练样本的地理位置相距不到5米,Argoverse 2数据集则有40%的样本存在类似问题。其次,构建地理上不重叠的数据集分割方案,以确保评估的公正性和准确性,是另一个重要挑战。此外,如何将现有的在线地图构建方法适应新的地理分割数据集,并验证其性能,也是实际应用中的难点。
常用场景
经典使用场景
nuScenes和Argoverse 2数据集在自动驾驶领域中被广泛用于在线地图构建的监督学习任务。这些数据集通过提供高精度的地理信息和传感器数据,使得研究人员能够训练和验证先进的在线地图生成算法。经典的使用场景包括基于这些数据集进行模型训练,以生成精确的地图信息,并在验证和测试集上评估模型的性能。
解决学术问题
nuScenes和Argoverse 2数据集解决了在线地图构建中的关键学术问题,即数据泄露问题。传统方法在训练、验证和测试集之间存在地理重叠,导致性能评估失真。通过引入地理上不重叠的分割方法,这些数据集有效避免了数据泄露,提供了更真实的性能评估,推动了在线地图构建技术的进步。
实际应用
在实际应用中,nuScenes和Argoverse 2数据集被用于开发和测试自动驾驶系统中的地图生成模块。这些模块在车辆导航、路径规划和环境感知中起着至关重要的作用。通过使用地理上不重叠的分割数据,开发者能够更准确地评估和优化地图生成算法的实际性能,从而提升自动驾驶系统的安全性和可靠性。
数据集最近研究
最新研究方向
在自动驾驶与在线地图构建领域,nuScenes和Argoverse 2数据集的研究正聚焦于解决数据泄露问题,尤其是地理重复性导致的性能评估偏差。当前最先进的在线地图方法主要依赖于监督学习,并在这些数据集上进行训练,然而训练、验证和测试集中的地理重复性导致了性能指标的虚高。为此,研究者提出了地理上不相交的分割方法,通过确保训练和测试样本在地理空间上完全分离,以更准确地评估模型的泛化能力。这一研究方向不仅提升了数据集的可靠性,还为自动驾驶系统的实际部署提供了更为稳健的评估框架,具有重要的理论与实践意义。
以上内容由遇见数据集搜集并总结生成



