five

Kidmose CANid Dataset (KCID)

收藏
arXiv2025-11-01 更新2025-11-05 收录
下载链接:
https://data.dtu.dk/articles/dataset/The_Kidmose_CANid_Dataset_KCID_/30483005
下载链接
链接失效反馈
官方服务:
资源简介:
Kidmose CANid Dataset (KCID)是一个新的数据集,提供了16位驾驶员在四辆不同车辆上行驶的原始CAN总线数据。该数据集包含驾驶员的基本人口统计数据以及日常驾驶和受控固定路线数据,旨在帮助研究人员开发鲁棒的驾驶员认证系统,并在真实条件下评估其性能。

Kidmose CANid Dataset (KCID) is a novel dataset that provides raw CAN bus data collected from 16 drivers operating four distinct vehicles. This dataset includes basic demographic data of the participating drivers, as well as data collected during both daily driving and controlled fixed-route driving scenarios. It is designed to assist researchers in developing robust driver authentication systems and evaluating their performance under real-world conditions.
提供机构:
Technical University of Denmark
创建时间:
2025-10-30
原始信息汇总

The Kidmose CANid Dataset (KCID) 数据集概述

数据集基本信息

  • 数据集名称: The Kidmose CANid Dataset (KCID)
  • 版本: 版本2 (2025-11-03, 15:48)
  • 作者: Brooke Elizabeth Kidmose, Andreas Brasen Kidmose
  • 发布日期: 2025-11-03
  • 数据量: 25.98 GB
  • 文件格式: .ZIP压缩包 (KCID-DATASET.zip)

数据集描述

Kidmose CANid Dataset (KCID) 包含从4辆不同车辆的16名驾驶员收集的CAN总线数据,专门用于支持驾驶员识别和认证研究。"CANid"反映了该数据集的双重目的:从CAN总线收集数据用于驾驶员识别研究。

车辆信息

数据集包含四辆不同车辆的数据:

  • 2011 Chevrolet Traverse: 5门全尺寸SUV跨界车,全轮驱动,8名驾驶员
  • 2017 Ford Focus: 5门紧凑型旅行车,前轮驱动,4名驾驶员
  • 2017 Subaru Forester: 5门紧凑型SUV跨界车,全轮驱动,6名驾驶员
  • 2022 Honda CR-V Touring: 5门紧凑型SUV跨界车,全轮驱动,1名驾驶员

驾驶员信息

数据集包含16名驾驶员,按人口统计分类:

  • 男性驾驶员:
    • 30岁以下: 4名驾驶员
    • 30-55岁: 4名驾驶员
    • 55岁以上: 3名驾驶员
  • 女性驾驶员: 5名驾驶员(所有年龄段)

数据收集地点

  • 丹麦 (DK)
  • 美国 (USA):
    • 佛罗里达州 (FL)
    • 内布拉斯加州 (NE)
    • 内布拉斯加州到佛罗里达州行程 (NE-to-FL)
    • 田纳西州 (TN)
    • 田纳西州到内布拉斯加州行程 (TN-to-NE)

数据收集方法

  • CANEdge: CSS Electronics CANEdge2 - 连接到OBD-II端口的独立数据记录器
  • Korlan: Korlan USB2CAN - 将车辆OBD-II端口连接到笔记本电脑的CAN转USB电缆
  • Kvaser: Kvaser Hybrid CAN-LIN - 将车辆OBD-II端口连接到笔记本电脑的CAN转USB电缆

文件格式

数据集提供三种格式的数据:

  • .mf4 (MDF4)格式: ASAM标准化的二进制格式,体积紧凑
  • .log格式: 基于文本的日志格式,兼容Linux SocketCAN can-utils
  • .csv格式: 基于文本的逗号分隔值格式,易于使用Python pandas加载

专业实验

数据集包含五个专业实验:

固定路线实验

  • 车辆: 2011 Chevrolet Traverse, 2017 Subaru Forester
  • 目的: 捕获特定可映射路线的CAN轨迹

OBD请求和响应实验

  • 车辆: 2011 Chevrolet Traverse
  • 目的: 捕获OBD请求和响应

轮胎压力实验

  • 车辆: 2011 Chevrolet Traverse
  • 目的: 捕获正常和低轮胎压力场景

驾驶模式和功能实验

  • 车辆: 2017 Ford Focus
  • 目的: 捕获不同驾驶模式

静止车辆实验

  • 车辆: 2024 Chevrolet Malibu, 2025 Toyota Corolla
  • 目的: 捕获现代车辆的CAN总线流量

研究应用

  • 驾驶员认证和指纹识别
  • 汽车领域的行为生物识别
  • 车辆诊断和预测性维护
  • 汽车领域的机器学习
  • CAN总线分析和逆向工程

引用信息

文章引用

APA格式: Kidmose, B. E., Kidmose, A. B., and Zou, C. C. (2025). A critical roadmap to driver authentication via CAN bus: Dataset review, introduction of the Kidmose CANid Dataset (KCID), and proof of concept. arXiv. https://arxiv.org/pdf/2510.25856

数据集引用

APA格式: Kidmose, B. E. and Kidmose, A. B. (2025). Kidmose CANid Dataset (KCID) v1. [Data set]. Technical University of Denmark. https://doi.org/10.11583/DTU.30483005.v1

许可证

  • CC BY 4.0

关键词

  • 驾驶员指纹识别、驾驶员认证、机器学习、汽车、网络物理系统、访问控制、授权、防盗、控制器区域网络(CAN)、车载网络(IVN)、驾驶行为、驾驶数据、行为生物识别
搜集汇总
数据集介绍
main_image_url
构建方式
在汽车网络安全研究领域,Kidmose CANid Dataset (KCID) 的构建采用了多维度数据采集策略。该数据集通过专业CAN总线接口设备(包括Korlan USB2CAN、Kvaser Hybrid CAN-LIN和CSS Electronics CANEdge2)直接捕获原始CAN总线流量,规避了传统诊断查询方式造成的信息损失。数据采集涵盖四款不同制造商车型,由16名驾驶员在真实日常驾驶与预设固定路线两种场景下完成,采样频率高达1-2.5kHz,确保了驾驶行为细微特征的完整保留。
特点
该数据集的核心特征体现在其突破性的数据架构设计。与现有依赖解码诊断数据的驱动指纹数据集不同,KCID首次提供原始CAN总线流量,完整保留了高时序精度的驾驶行为模式。数据集包含超过10亿条CAN消息,覆盖不同年龄段、性别和驾驶经验的驾驶员群体,并整合了关键人口统计信息。其多格式存储方案(.log/.csv/.mf4)与专业化实验设计(如胎压监测、固定路线对比)进一步增强了数据集的科研适配性。
使用方法
研究人员可通过DTU Data平台获取该数据集,利用其多格式特性适配不同分析流程。原始CAN数据需通过信号反工程技术提取行为特征,可结合时序分析、机器学习聚类或深度学习网络构建驾驶身份认证模型。数据集支持从初始特征工程到模型验证的全流程研究,特别适用于开发跨车型泛化的认证系统。固定路线实验数据为算法基准测试提供受控环境,而日常驾驶数据则确保模型在真实场景下的鲁棒性验证。
背景与挑战
背景概述
随着汽车电子系统安全漏洞日益凸显,Kidmose CANid Dataset (KCID) 于2025年由丹麦技术大学与中佛罗里达大学联合发布,旨在应对控制器局域网总线面临的未授权访问威胁。该数据集聚焦于驾驶行为生物特征识别领域,通过采集四款车型中16名驾驶员的原始CAN总线数据,突破了传统诊断数据的局限性。其创新性在于融合了人口统计信息与真实驾驶场景,为构建可部署的驾驶员认证系统提供了关键数据支撑,显著推动了汽车网络安全与行为生物计量学的研究进程。
当前挑战
在解决车辆未授权访问问题时,现有驾驶员认证系统面临跨车型泛化能力不足与相似人口特征驾驶员区分困难的挑战。数据集构建过程中需克服多重技术障碍:原始CAN总线数据包含大量与驾驶行为无关的周期性噪声信号,需通过特征工程与机器学习方法进行有效过滤;制造商特定的十六进制数据帧需依赖逆向工程解析,增加了数据解读复杂度;同时,高频率采样产生的海量数据对存储与处理能力提出严格要求,而不同车型CAN协议差异进一步提高了数据标准化难度。
常用场景
经典使用场景
在车辆网络安全领域,Kidmose CANid Dataset (KCID) 作为首个提供原始CAN总线数据的公开数据集,其经典应用场景聚焦于驾驶员行为生物特征识别研究。通过采集16名驾驶员在四款不同车型上的真实驾驶数据,该数据集为机器学习算法提供了丰富的训练素材,支持从高频CAN消息流中提取独特的驾驶模式特征,例如油门踏板动态响应、转向操作细腻度以及制动习惯的时序变化,从而构建精准的驾驶员身份认证模型。
衍生相关工作
该数据集的发布催生了多项创新研究,例如结合长短期记忆网络与全卷积网络的混合模型,实现了对CAN序列时空特征的联合提取;基于生成对抗网络的异常检测框架,仅利用合法驾驶员数据就能构建盗用行为识别器;另有研究将信号反工程技术与随机森林分类器结合,成功在不同车型间迁移驾驶特征识别模型。这些工作共同推动了车载身份认证从理论验证向工程实践的跨越。
数据集最近研究
最新研究方向
随着汽车网络安全威胁日益复杂化,Kidmose CANid Dataset (KCID) 在车辆安全认证领域开辟了多个前沿研究方向。基于原始CAN总线数据的驾驶员行为生物特征识别成为研究热点,通过高频率采样捕获驾驶员的细微操作模式,为构建深度防御体系提供数据支撑。该数据集支持跨车型通用认证算法的开发,解决了现有方法在车辆多样性方面的局限性。驾驶员人口统计信息的融入使研究者能够评估认证系统在不同年龄段和性别群体中的表现差异,这对于防止未成年人盗车等社会热点事件具有重要现实意义。数据集在机械异常检测和危险驾驶行为识别方面的扩展应用,进一步推动了汽车网络安全与主动安全系统的深度融合。这些研究方向不仅提升了车辆防盗能力,更为保险风险评估和车队管理等商业应用提供了技术基础。
相关研究论文
  • 1
    通过Technical University of Denmark · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作