Safety2Drive
收藏arXiv2025-05-20 更新2025-05-22 收录
下载链接:
http://arxiv.org/abs/2505.13872v1
下载链接
链接失效反馈官方服务:
资源简介:
Safety2Drive是一个为评估自动驾驶系统而设计的安全关键场景库。该库全面涵盖了标准法规要求的测试项目,包含70个自动驾驶功能测试项目。它支持安全关键场景的泛化,能够注入如自然环境破坏和对抗性攻击等安全威胁,通过跨相机和激光雷达传感器的破坏来评估自动驾驶系统的鲁棒性和安全性。Safety2Drive还支持多维度评估,除了评估自动驾驶系统外,还支持对各种感知任务,如物体检测和车道检测的评估。该数据集旨在解决当前驾驶数据集中对安全关键场景的代表性不足,以及由此导致的不完整评估自动驾驶性能的问题。
Safety2Drive is a safety-critical scenario library developed for evaluating autonomous driving (AD) systems. It comprehensively covers test items required by standard regulations, including 70 autonomous driving function test cases. It supports the generalization of safety-critical driving scenarios, and allows the injection of security threats such as natural environmental corruptions and adversarial attacks, to assess the robustness and safety of AD systems via corruptions across camera and LiDAR sensors. Additionally, Safety2Drive supports multi-dimensional evaluation: besides evaluating complete autonomous driving systems, it also enables the assessment of various perception tasks such as object detection and lane detection. This dataset aims to address the issues of insufficient representation of safety-critical scenarios in current driving datasets, as well as the resulting incomplete evaluation of autonomous driving performance.
提供机构:
北京航空航天大学
创建时间:
2025-05-20
搜集汇总
数据集介绍

构建方式
Safety2Drive数据集的构建采用了系统化的方法,结合了手工设计场景和基于大型语言模型(LLM)的场景生成技术。首先,研究团队对现有的自动驾驶功能测试标准(如ISO34504、C-NCAP和E-NCAP)进行了全面审查,总结了6大类共70项标准化功能测试项目。这些场景通过ASAM OpenSCENARIO标准2.0进行动态交互配置,包括交通参与者行为逻辑、道路条件和环境变量等参数。此外,数据集还集成了ChatScene框架,通过LLM将用户输入的自然语言指令转化为结构化描述,并生成可执行的场景脚本,从而实现了灵活且高效的场景扩展。
特点
Safety2Drive数据集的核心特点在于其全面覆盖了标准法规要求的安全关键场景,并具备场景泛化能力。数据集不仅包含了70项符合国际标准的功能测试项目,还支持通过自然环境干扰(如天气、传感器和物体层面的20种干扰类型)和对抗攻击(包括数字攻击、物理攻击和后门攻击)将标准场景转化为安全关键场景。此外,数据集提供了从感知任务到系统级评估的多维度评测框架,支持对多种自动驾驶系统(如端到端和基于视觉语言模型的系统)的闭环测试,填补了现有开源数据集中在安全验证方面的空白。
使用方法
Safety2Drive数据集的使用需依托CARLA仿真平台,支持传感器配置(如摄像头、激光雷达和高精地图)。用户可通过OpenSCENARIO格式的参数化配置动态调整场景参数,实现批量测试。对于感知任务评估,数据集提供了对象检测、车道检测等任务的基准模型(如YoloV5、PointPillars和CLRNet)及评测指标(如AP、Accuracy)。在系统级测试中,用户可通过注入自然干扰或对抗攻击来验证自动驾驶系统的鲁棒性,并使用驾驶分数(Route Completion、Infractions Penalty等)量化安全性能。数据集还提供了Leaderboard功能,支持不同自动驾驶系统的横向对比。
背景与挑战
背景概述
Safety2Drive是由中关村实验室和北京航空航天大学等机构的研究团队于2025年提出的自动驾驶安全评估基准数据集。该数据集针对现有开源基准如Longest6和Bench2Drive在闭环测试中缺乏符合监管要求场景库的缺陷,重点解决自动驾驶系统在安全关键场景下的功能安全评估问题。作为首个支持标准法规功能测试的开源场景库,其核心贡献体现在三方面:覆盖ISO 34504等标准要求的70项功能测试项目、支持自然环境干扰与对抗攻击的安全威胁注入能力、以及从感知任务到系统级的多维度评估框架。该数据集通过OpenSCENARIO标准化格式实现参数化配置,为自动驾驶安全验证建立了从场景构建到评估的完整范式。
当前挑战
在领域问题层面,Safety2Drive致力于解决自动驾驶系统在长尾边缘场景(如行人横穿、车辆切入等安全关键场景)中性能评估不足的挑战。现有数据集普遍存在场景分布偏差问题,例如nuScenes验证集中75%为非交互式直线行驶场景。在构建过程中,研究团队面临三大技术挑战:一是如何系统化实现标准法规要求的70项功能测试项目;二是设计跨摄像头与激光雷达传感器的自然环境干扰(20种天气/传感器/物体级干扰)与对抗攻击(数字/物理/后门攻击)生成方法;三是构建涵盖感知算法(如目标检测)到系统级评估(如碰撞率)的统一评估指标体系。这些挑战通过参数化场景配置、安全威胁注入工具箱和多维度评估模块的创新设计得以克服。
常用场景
经典使用场景
Safety2Drive作为自动驾驶领域的安全关键场景基准测试库,其经典使用场景主要聚焦于闭环仿真环境下对自动驾驶系统的功能安全评估。该数据集通过构建70个符合ISO 34504等国际标准的测试项目,覆盖了自适应巡航、紧急制动、交通标志识别等核心驾驶功能。研究人员可利用其参数化配置能力,动态调整环境参数(如天气条件、交通参与者行为)以生成多样化测试用例,特别适用于评估系统在长尾边缘场景(如行人突然横穿、恶劣天气下的传感器失效)中的表现。
实际应用
在产业实践中,Safety2Drive已被应用于多家车企的自动驾驶安全验证流程。例如,通过其天气级腐蚀模块(强光/雨雪模拟)可测试摄像头在极端环境下的目标检测稳定性;物理对抗攻击场景能评估系统对路标篡改等现实威胁的防御能力。某头部自动驾驶公司利用该数据集发现了传统感知模型在局部点云密度异常(Local Density Decrease)场景下高达42.6%的漏检率,推动了多模态融合算法的升级。
衍生相关工作
该数据集催生了一系列创新研究:在对抗攻击领域,Zhongguancun实验室基于其数字攻击模块开发了TC-EGA伪装攻击算法(CVPR 2024);北京大学团队利用后门攻击场景提出了面向目标检测的OGA攻击框架。在评估体系方面,SafeBench(NeurIPS 2022)扩展了其事故场景生成逻辑,而ChatScene(CVPR 2024)则继承LLM-based场景生成能力构建了文本到驾驶场景的映射范式。这些工作共同推动了自动驾驶安全评估从静态测试向动态威胁演进的范式转变。
以上内容由遇见数据集搜集并总结生成



