ROAD
收藏arXiv2021-01-15 更新2024-06-21 收录
下载链接:
https://arxiv.org/abs/2012.14600
下载链接
链接失效反馈官方服务:
资源简介:
ROAD数据集是由橡树岭国家实验室发布的第一个开放的CAN IDS数据集,包含真实的非模拟隐秘攻击数据,具有物理验证效果。该数据集包括12个环境捕获日志和33个攻击捕获日志,总时长约3小时。数据集的创建过程涉及对车辆CAN总线的直接访问和攻击模拟,旨在通过分析消息时间间隔异常来检测制造攻击。ROAD数据集的应用领域主要集中在汽车网络安全,特别是针对控制器局域网络(CAN)的入侵检测系统,以解决车辆安全面临的日益增长的攻击威胁。
The ROAD dataset, released by Oak Ridge National Laboratory, is the first open-access CAN IDS dataset. It contains real, non-simulated stealth attack data that has been physically validated. This dataset includes 12 ambient capture logs and 33 attack capture logs, with a total duration of roughly 3 hours. The creation of this dataset involved direct access to the vehicle CAN bus and attack simulation, aiming to detect crafted attacks by analyzing abnormalities in the time intervals of CAN messages. The primary application scope of the ROAD dataset lies in automotive cybersecurity, particularly for Controller Area Network (CAN) intrusion detection systems, to address the escalating attack threats to vehicle security.
提供机构:
橡树岭国家实验室
创建时间:
2021-01-15
搜集汇总
数据集介绍

构建方式
在汽车网络安全领域,控制器局域网(CAN)作为车辆内部电子控制单元(ECU)通信的核心协议,其安全性至关重要。ROAD数据集的构建基于真实车辆环境,通过物理接入车载诊断(OBD-II)端口引入完全受控的ECU节点,实施了多种非模拟的隐蔽性攻击,包括使用火焰(flam)交付方式的针对性ID攻击、模糊测试攻击等。数据采集过程涵盖约3小时的正常驾驶日志和30分钟的攻击日志,所有攻击均经过物理验证,确保数据的高保真度。为保护车辆隐私,数据进行了匿名化处理,同时保留了入侵检测系统(IDS)测试所需的关键特征,使得该数据集成为首个公开的、包含真实攻击且具有物理验证效果的CAN IDS基准数据集。
特点
ROAD数据集在汽车网络安全研究中具有显著特点。其核心优势在于提供了真实而非模拟的攻击数据,攻击类型覆盖了隐蔽性极强的火焰交付针对性ID攻击,这些攻击通过精细的时间扰动实现,对基于时间的入侵检测方法构成了严峻挑战。数据集包含12个正常驾驶日志和33个攻击日志,总计约178.8分钟的正常数据和28.4分钟的攻击数据,攻击消息占比约3.9%,形成了高度不平衡的测试环境。此外,数据采集于真实车辆的底盘测功机环境,攻击效果均经过物理验证,确保了数据的可靠性和现实相关性,为评估和比较时间型IDS方法提供了高质量的基准。
使用方法
ROAD数据集的使用方法侧重于时间型入侵检测系统的训练与评估。在训练阶段,研究者通常利用数据集中的正常驾驶日志(如底盘测功机采集的10个日志)来建模每个仲裁ID(AID)的消息间隔时间分布,可采用如均值计算、分箱统计或概率分布拟合等方法。测试阶段则使用包含攻击的日志(如16个攻击日志)来验证检测性能,评估指标包括精确率-召回率曲线(PR曲线)及其曲线下面积(AUC-PR),以应对数据不平衡问题。数据集支持多种检测方法,例如基于均值的启发式方法、分箱计数方法,以及基于高斯分布或核密度估计的统计方法,研究者可通过比较不同方法在真实攻击下的表现,推动汽车网络安全技术的进步。
背景与挑战
背景概述
随着现代车辆演变为复杂的网络物理系统,其内部数百个电子控制单元通过控制器局域网进行通信,这一架构的复杂性显著扩大了CAN总线的攻击面,使其易于遭受消息注入攻击。为应对这一安全挑战,基于时间的入侵检测系统应运而生,旨在通过分析消息时序异常来识别恶意活动。然而,该领域长期缺乏高质量、真实攻击标注的公开数据集,制约了IDS的评估与比较。在此背景下,ROAD数据集于2021年由美国橡树岭国家实验室与肯塔基大学的研究团队联合发布,作为首个包含真实物理验证攻击的开放CAN IDS数据集,其核心研究问题聚焦于提供高保真基准数据,以推动车载网络安全检测技术的可靠验证与性能提升,对自动驾驶与车辆网络安全领域产生了深远影响。
当前挑战
ROAD数据集致力于解决车载CAN网络入侵检测中时序异常识别的核心挑战,特别是在面对隐蔽性极强的伪造攻击时,传统检测方法因依赖低仿真数据集而表现受限。构建过程中的主要挑战包括:其一,采集真实物理攻击数据需在确保车辆安全的前提下精确控制攻击注入与效果验证,技术实施复杂度高;其二,数据匿名化处理必须在保护车辆隐私的同时保留关键时序特征,以维持数据集的科研效用;其三,攻击场景的设计需涵盖多种隐蔽攻击模式,如使用火焰交付的定向ID攻击,以全面评估检测方法的鲁棒性。这些挑战共同塑造了数据集的高标准与独特性。
常用场景
经典使用场景
在汽车网络安全领域,ROAD数据集作为首个公开的、包含真实物理验证攻击的控制器局域网(CAN)入侵检测基准,其经典使用场景聚焦于评估和比较基于时间的入侵检测系统(IDS)。该数据集通过模拟车辆在真实环境中遭受的隐蔽性伪造攻击,特别是采用火焰(flam)交付方式的针对性ID攻击,为研究者提供了一个高保真的测试平台。通过分析CAN总线消息的时间间隔分布,研究人员能够训练和验证检测算法,以识别恶意消息注入所引发的时序异常,从而推动车载网络安全技术的实证研究。
实际应用
在实际应用层面,ROAD数据集为汽车行业的安全防护技术开发提供了重要支撑。基于该数据集训练的入侵检测系统可部署于车载边缘计算设备,如通过OBD-II接口连接的插件硬件,实现实时监控CAN总线消息时序。这种轻量级解决方案能够即时识别伪造攻击,并通过视觉警报提示驾驶员,有效防范远程或直接总线访问导致的安全威胁,如车辆控制篡改或拒绝服务攻击。此外,数据集的公开性促进了学术界与工业界的协作,加速了高精度、低延迟检测算法的产品化进程,提升了现代车辆的整体网络韧性。
衍生相关工作
ROAD数据集的发布催生了一系列相关的经典研究工作,特别是在基于时间的CAN入侵检测方法比较与优化领域。例如,原论文中系统性地评估了均值间隔时间法、分箱法、高斯分布拟合法和核密度估计法四种检测方法,揭示了分箱法在精确率-召回率曲线下面积(AUC-PR)上的优越性能。后续研究在此基础上进一步探索了混合检测框架、自适应阈值算法以及结合载荷分析的多元异常检测模型,以应对更复杂的攻击类型如伪装攻击。这些衍生工作不仅扩展了数据集的利用维度,也为车载网络安全标准的制定提供了实证依据。
以上内容由遇见数据集搜集并总结生成



