KITTI-AR
收藏arXiv2025-07-12 更新2025-07-16 收录
下载链接:
https://github.com/xxxx/xxx
下载链接
链接失效反馈官方服务:
资源简介:
KITTI-AR数据集是由上海大学通信与信息工程学院的研究团队创建的,用于3D异常物体检测。该数据集基于现有的KITTI数据集,通过3D渲染方法增加了97个新的类别,总共包含6千对立体图像。此外,KITTI-AR-ExD子集包含了39个常见类别作为额外训练数据,而KITTI-AR-OoD子集则包含了58个稀有类别,用于模拟真实世界中的零样本场景。该数据集旨在验证和提升异常检测的泛化能力。
The KITTI-AR dataset was developed by the research team from the School of Communication and Information Engineering, Shanghai University, for 3D anomalous object detection. Built upon the established KITTI dataset, this dataset adds 97 new categories via 3D rendering techniques, with a total of 6,000 pairs of stereo images. In addition, the KITTI-AR-ExD subset provides 39 common categories as supplementary training data, while the KITTI-AR-OoD subset contains 58 rare categories designed to simulate real-world zero-shot scenarios. The primary goal of this dataset is to validate and enhance the generalization capability of anomaly detection systems.
提供机构:
上海大学通信与信息工程学院
创建时间:
2025-07-12
搜集汇总
数据集介绍

构建方式
KITTI-AR数据集通过3D渲染技术在KITTI数据集基础上构建,采用Blender软件将97种新类别的3D模型合成到原始KITTI双目立体图像中。具体流程包括虚拟相机参数校准、障碍物可放置区域计算,以及3D模型的几何中心坐标转换。该数据集包含6,000对立体图像,分为KITTI-AR-ExD和KITTI-AR-OoD两个子集,前者包含39个常见室内物体类别用于扩展训练样本,后者包含58个罕见类别专门用于模拟零样本场景下的3D异常检测评估。
特点
KITTI-AR数据集的核心特点体现在三个方面:类别多样性方面新增97个未见类别,显著扩展了传统自动驾驶数据集的语义覆盖范围;场景真实性方面通过增强现实技术保留原始KITTI的真实背景风格,有效降低虚拟与现实的域差异;评估体系方面创新性地采用解耦设计,将训练集与测试集的类别完全隔离,为3D异常检测算法提供严格的零样本评估基准。特别值得注意的是,该数据集首次在立体视觉维度提供了精确的3D边界框标注,包括位置、尺度和方向信息。
使用方法
该数据集主要用于3D异常检测算法的训练与验证。使用时应遵循严格的协议:KITTI-AR-ExD子集可配合原始KITTI数据共同训练,重点解决训练样本尺度分布稀疏性问题;KITTI-AR-OoD子集仅用于测试阶段,评估模型对未见过类别的检测能力。典型应用流程包括:首先基于立体特征构建类别无关的前景检测器,其次通过解耦策略分离2D与3D监督信号,最后采用RbAF等异常评分机制识别分布外目标。数据集特别适用于研究开放世界场景下的立体视觉3D检测问题。
背景与挑战
背景概述
KITTI-AR数据集由上海大学通信与信息工程学院的研究团队于2024年创建,旨在解决自动驾驶领域中3D异常物体检测的关键问题。该数据集基于著名的KITTI数据集扩展而来,新增了97个类别,共计6000对立体图像,分为KITTI-AR-ExD和KITTI-AR-OoD两个子集,分别用于训练和评估。KITTI-AR的提出填补了3D异常检测数据集的空白,为自动驾驶系统的安全性和鲁棒性研究提供了重要支持。该数据集通过增强现实技术合成,保留了真实场景的背景风格,同时引入了多样化的异常物体,为3D检测模型的泛化能力评估提供了标准化平台。
当前挑战
KITTI-AR数据集面临的主要挑战包括:1) 领域问题方面,传统3D检测模型在开放世界中难以识别未知类别的异常物体,存在误检和漏检风险;2) 构建过程中,虚拟与现实场景的域差异、相机参数标定、3D模型与真实背景的自然融合等技术难题需要克服。此外,数据集的规模扩展和标注质量保证也是重要挑战,特别是在3D框标注成本高昂的情况下,如何高效生成大规模高质量数据成为关键问题。
常用场景
经典使用场景
KITTI-AR数据集在自动驾驶领域的3D异常物体检测研究中扮演着关键角色。该数据集通过扩展KITTI数据集,新增了97个类别,总计6k对立体图像,为研究者提供了一个丰富的测试平台。其经典使用场景包括训练和验证3D异常检测算法,特别是在开放世界环境下检测罕见或未知类别的物体。数据集的设计使得研究者能够模拟真实世界中的零样本场景,从而评估算法在复杂环境中的泛化能力。
解决学术问题
KITTI-AR数据集解决了自动驾驶领域中3D检测模型在封闭集训练下对异常物体检测不足的问题。通过提供多样化的物体类别和尺度分布,该数据集帮助研究者克服了2D与3D训练耦合以及训练样本尺度分布不足的限制。其意义在于推动了开放集3D检测技术的发展,使得模型能够更好地识别和定位未知类别的障碍物,从而提升自动驾驶系统的安全性和可靠性。
衍生相关工作
KITTI-AR数据集衍生了一系列经典研究工作,如基于立体视觉的3D异常检测算法(S3AD)。该算法通过解耦2D和3D训练策略,释放了模型对任意3D前景检测的泛化能力。此外,数据集还启发了其他相关研究,如开放词汇3D检测(OV-Uni3DETR)和单目3D开放集检测(OV-Mono3D),进一步推动了自动驾驶感知技术的发展。
以上内容由遇见数据集搜集并总结生成



