five

Car Crash Dataset (CCD)|交通意外分析数据集|自动驾驶安全数据集

收藏
github2024-05-10 更新2024-05-31 收录
交通意外分析
自动驾驶安全
下载链接:
https://github.com/Cogito2012/CarCrashDataset
下载链接
链接失效反馈
资源简介:
Car Crash Dataset (CCD) 是为交通意外分析收集的数据集。它包含由安装在行驶车辆上的行车记录仪捕捉的真实交通意外视频,这对开发保证安全性的自动驾驶系统至关重要。CCD与现有数据集的区别在于其多样化的意外标注,包括环境属性(白天/夜晚,雪天/雨天/良好天气条件)、是否涉及自车、事故参与者和事故原因描述。

The Car Crash Dataset (CCD) is a collection specifically gathered for traffic accident analysis. It comprises real traffic accident videos captured by dashcams installed in moving vehicles, which are crucial for developing safety-assured autonomous driving systems. What sets CCD apart from existing datasets is its diverse accident annotations, including environmental attributes (day/night, snowy/rainy/good weather conditions), whether the host vehicle is involved, participants in the accident, and descriptions of the causes of accidents.
创建时间:
2020-05-31
原始信息汇总

CarCrashDataset 概述

数据集内容

数据集描述

Car Crash Dataset (CCD) 是一个专为交通意外分析收集的数据集。该数据集包含由安装在行驶车辆上的行车记录仪捕捉的真实交通意外视频。CCD 的特点在于其多样化的意外标注,包括环境属性(如白天/夜晚、雪天/雨天/晴朗天气条件)、是否涉及自车、事故参与者及事故原因描述。

数据集下载

CCD 数据集可通过 Google Drive 下载。

数据集结构

文件结构

CarCrash ├── codes # 用于分析数据集的有用代码 ├── vgg16_features │ ├── positive # 正面(事故)视频的特征文件 │ │ ├── 000001.npz │ │ ├── ... │ │ └── 001500.npz │ ├── negative # 负面(正常)视频的特征文件 │ │ ├── 000001.npz │ │ ├── ... │ │ └── 003000.npz │ ├── train.txt # 训练分割的列表文件 │ └── test.txt # 测试分割的列表文件 ├── videos │ ├── Normal # 正常驾驶视频 │ │ ├── 000001.mp4 │ │ ├── ... │ │ └── 003000.mp4 │ ├── Crash-1500 # 碰撞事故视频 │ │ ├── 000001.mp4 │ │ ├── ... │ │ └── 001500.mp4 │ └── Crash-1500.txt # 碰撞事故的标注文件 └── README.md

视频和特征

  • 视频: 收集自 YouTube 频道的交通意外视频,共 1,500 个修剪后的视频,每个视频包含 50 帧,每秒 10 帧。另外,3,000 个正常视频是从 BDD100K 数据集随机抽样得到。
  • 特征: vgg16_features/ 文件夹中的特征文件包含所有帧和检测到的边界框的 VGG-16 特征。每个特征文件(如 000001.npz)包含以下数据:
    • data: 提取的 4096 维特征,形状为 (50, 20, 4096)。
    • det: 检测到的边界框,形状为 (50, 19, 6)。
    • labels: 视频标签,指示视频是否包含事故。
    • ID: 当前特征文件的视频名称。

标注格式

1,500 个事故视频的标注保存在文件 CarCrash/videos/Crash-1500.txt 中。每行提供以下信息:

  • vidname: 每个事故视频的名称。
  • binlabels: 每个视频所有 50 帧的二进制标签。
  • startframe: 原始未修剪 YouTube 视频中的起始帧。
  • youtubeID: 原始 YouTube 视频的数字 ID。
  • timing: 时间条件,如 DayNight
  • weather: 天气条件,如 Normal, Snowy, 和 Rainy
  • egoinvolve: 指示自车是否参与该视频中的事故的布尔标识。

注意: 当前版本的 CCD 仅提供上述时间标注和环境属性。更详细的标注如交通意外原因和轨迹,将很快发布。

引用信息

如需引用此数据集,请使用以下引用格式:

@InProceedings{BaoMM2020, author = {Bao, Wentao and Yu, Qi and Kong, Yu}, title = {Uncertainty-based Traffic Accident Anticipation with Spatio-Temporal Relational Learning}, booktitle = {ACM Multimedia Conference}, month = {May}, year = {2020} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
Car Crash Dataset (CCD) 的构建基于真实交通事故视频,这些视频由安装在行驶车辆上的行车记录仪捕捉。数据集的收集过程包括从YouTube频道获取事故视频,并将其剪辑成1500个片段,每个片段包含50帧,帧率为10帧每秒。此外,3000个正常驾驶视频从BDD100K数据集中随机抽取。为了增强数据集的分析能力,研究人员使用VGG-16模型提取了所有帧和检测到的边界框的特征,这些特征存储在vgg16_features文件夹中。通过使用MMDetection代码库训练的Cascade R-CNN模型,结合ResNeXt-101骨干网络和FPN颈部结构,对KITTI 2D检测数据集进行对象检测,从而提取出每个视频的前19个边界框的特征。
特点
CCD数据集的显著特点在于其多样化的注释,包括环境属性(如白天/夜晚、雪天/雨天/良好天气条件)、是否涉及自车、事故参与者以及事故原因描述。这些注释不仅提供了时间上的标记,还涵盖了环境因素,为研究交通事故的复杂性提供了丰富的信息。此外,数据集中的视频和特征文件结构清晰,便于研究人员进行分析和处理。每个特征文件不仅包含提取的4096维特征,还提供了检测到的边界框和视频标签,这些信息对于构建安全保障的自动驾驶系统至关重要。
使用方法
使用CCD数据集时,研究人员应首先确保下载的文件结构符合README文件中的描述。数据集的文件夹结构包括代码、视频和特征文件,其中视频文件夹包含正常驾驶和事故视频,而特征文件夹则包含从这些视频中提取的VGG-16特征。研究人员可以通过train.txt和test.txt文件进行训练和测试集的划分。对于特征文件,每个文件提供了帧级和边界框级的特征,以及检测到的边界框和视频标签。此外,Crash-1500.txt文件提供了1500个事故视频的详细注释,包括视频名称、帧标签、起始帧、YouTube视频ID、时间条件、天气条件和是否涉及自车等信息。
背景与挑战
背景概述
在自动驾驶和交通安全领域,Car Crash Dataset (CCD) 的创建标志着对交通事故分析和预防研究的重要进展。该数据集由Wentao Bao、Qi Yu和Kong Yu等研究人员于2020年开发,旨在为交通意外的预测提供丰富的数据支持。CCD包含了由行车记录仪捕捉的真实交通事故视频,这些视频不仅记录了事故发生的瞬间,还详细标注了环境属性、是否涉及自车、事故参与者及事故原因等多元化信息。这些详尽的标注为开发安全保障型自动驾驶系统提供了关键数据,极大地推动了该领域的研究进展。
当前挑战
尽管CCD在交通事故分析方面提供了丰富的数据资源,但其构建和应用过程中仍面临诸多挑战。首先,数据集的构建涉及从YouTube等平台收集和筛选视频,这一过程需要确保数据的准确性和代表性。其次,视频的标注工作复杂且耗时,特别是对事故原因和参与者等细节的标注,需要专业知识和严格的质量控制。此外,数据集的使用也面临技术挑战,如如何高效地提取和利用视频中的特征信息,以及如何处理和分析大规模的标注数据,这些都是当前研究中需要克服的重要问题。
常用场景
经典使用场景
在自动驾驶和交通安全领域,Car Crash Dataset (CCD) 数据集被广泛用于交通意外预测模型的开发与验证。该数据集通过收集真实驾驶环境中的碰撞视频,为研究人员提供了丰富的视觉和环境信息,从而支持构建更为精准的碰撞预测算法。通过分析视频中的视觉特征和环境属性,研究人员能够训练模型以识别潜在的碰撞风险,进而提升自动驾驶系统的安全性。
实际应用
在实际应用中,CCD 数据集为自动驾驶系统的开发提供了重要的支持。通过分析数据集中的碰撞视频,自动驾驶系统能够学习识别潜在的碰撞风险,并在实际驾驶中采取预防措施。此外,该数据集还可用于训练和验证交通管理系统的算法,帮助交通管理部门更有效地监控和预防交通事故,从而提升道路交通的整体安全性。
衍生相关工作
基于 CCD 数据集,研究人员已开展了一系列相关工作,包括但不限于碰撞预测模型的优化、环境感知算法的改进以及多模态数据融合技术的探索。例如,有研究利用该数据集开发了基于时空关系学习的碰撞预测模型,显著提升了预测的准确性。此外,CCD 数据集还激发了关于如何更有效地利用视觉和环境信息的研究,推动了自动驾驶和交通安全领域的技术进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中文突发事件语料库

中文突发事件语料库是由上海大学(语义智能实验室)所构建,根据国务院颁布的《国家突发公共事件总体应急预案》的分类体系,从互联网上收集了5类(地震、火灾、交通事故、恐怖袭击和食物中毒)突发事件的新闻报道作为生语料,然后再对生语料进行文本预处理、文本分析、事件标注以及一致性检查等处理,最后将标注结果保存到语料库中,CEC合计332篇。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

emotions-dataset

情绪数据集是一个精心策划的文本数据集,包含131,306个文本条目,标注了13种不同的情绪,如快乐、悲伤、中性、愤怒等。该数据集旨在提升情感分类、情感分析和自然语言处理的能力,适用于构建富有同情心的聊天机器人、心理健康工具、社交媒体分析器等。数据集文件大小为7.41MB,便于在边缘设备和大型项目中使用。

huggingface 收录

CODrone

CODrone 是一个为无人机设计的全面定向目标检测数据集,它准确反映了真实世界条件。该数据集包含来自多个城市在不同光照条件下的广泛标注图像,增强了基准的逼真度。CODrone 包含超过 10,000 张高分辨率图像,捕获自五个城市的真实无人机飞行,涵盖了各种城市和工业环境,包括港口和码头。为了提高鲁棒性和泛化能力,它包括在正常光线、低光和夜间条件下相同场景的图像。我们采用了三种飞行高度和两种常用的相机角度,从而产生了六个不同的视角配置。所有图像都针对 12 个常见对象类别进行了定向边界框标注,总计超过 590,000 个标记实例。总体而言,这项工作构建了一个综合数据集和基准,用于城市无人机场景中的定向目标检测,旨在满足该领域的研究和实践应用需求。

arXiv 收录

VEDAI

用于训练YOLO模型的VEDAI数据集,包含图像和标签,用于目标检测和跟踪。

github 收录