Car Crash Dataset (CCD)|交通意外分析数据集|自动驾驶安全数据集
收藏CarCrashDataset 概述
数据集内容
数据集描述
Car Crash Dataset (CCD) 是一个专为交通意外分析收集的数据集。该数据集包含由安装在行驶车辆上的行车记录仪捕捉的真实交通意外视频。CCD 的特点在于其多样化的意外标注,包括环境属性(如白天/夜晚、雪天/雨天/晴朗天气条件)、是否涉及自车、事故参与者及事故原因描述。
数据集下载
CCD 数据集可通过 Google Drive 下载。
数据集结构
文件结构
CarCrash ├── codes # 用于分析数据集的有用代码 ├── vgg16_features │ ├── positive # 正面(事故)视频的特征文件 │ │ ├── 000001.npz │ │ ├── ... │ │ └── 001500.npz │ ├── negative # 负面(正常)视频的特征文件 │ │ ├── 000001.npz │ │ ├── ... │ │ └── 003000.npz │ ├── train.txt # 训练分割的列表文件 │ └── test.txt # 测试分割的列表文件 ├── videos │ ├── Normal # 正常驾驶视频 │ │ ├── 000001.mp4 │ │ ├── ... │ │ └── 003000.mp4 │ ├── Crash-1500 # 碰撞事故视频 │ │ ├── 000001.mp4 │ │ ├── ... │ │ └── 001500.mp4 │ └── Crash-1500.txt # 碰撞事故的标注文件 └── README.md
视频和特征
- 视频: 收集自 YouTube 频道的交通意外视频,共 1,500 个修剪后的视频,每个视频包含 50 帧,每秒 10 帧。另外,3,000 个正常视频是从 BDD100K 数据集随机抽样得到。
- 特征:
vgg16_features/文件夹中的特征文件包含所有帧和检测到的边界框的 VGG-16 特征。每个特征文件(如000001.npz)包含以下数据:- data: 提取的 4096 维特征,形状为 (50, 20, 4096)。
- det: 检测到的边界框,形状为 (50, 19, 6)。
- labels: 视频标签,指示视频是否包含事故。
- ID: 当前特征文件的视频名称。
标注格式
1,500 个事故视频的标注保存在文件 CarCrash/videos/Crash-1500.txt 中。每行提供以下信息:
- vidname: 每个事故视频的名称。
- binlabels: 每个视频所有 50 帧的二进制标签。
- startframe: 原始未修剪 YouTube 视频中的起始帧。
- youtubeID: 原始 YouTube 视频的数字 ID。
- timing: 时间条件,如
Day和Night。 - weather: 天气条件,如
Normal,Snowy, 和Rainy。 - egoinvolve: 指示自车是否参与该视频中的事故的布尔标识。
注意: 当前版本的 CCD 仅提供上述时间标注和环境属性。更详细的标注如交通意外原因和轨迹,将很快发布。
引用信息
如需引用此数据集,请使用以下引用格式:
@InProceedings{BaoMM2020, author = {Bao, Wentao and Yu, Qi and Kong, Yu}, title = {Uncertainty-based Traffic Accident Anticipation with Spatio-Temporal Relational Learning}, booktitle = {ACM Multimedia Conference}, month = {May}, year = {2020} }

中文突发事件语料库
中文突发事件语料库是由上海大学(语义智能实验室)所构建,根据国务院颁布的《国家突发公共事件总体应急预案》的分类体系,从互联网上收集了5类(地震、火灾、交通事故、恐怖袭击和食物中毒)突发事件的新闻报道作为生语料,然后再对生语料进行文本预处理、文本分析、事件标注以及一致性检查等处理,最后将标注结果保存到语料库中,CEC合计332篇。
github 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
emotions-dataset
情绪数据集是一个精心策划的文本数据集,包含131,306个文本条目,标注了13种不同的情绪,如快乐、悲伤、中性、愤怒等。该数据集旨在提升情感分类、情感分析和自然语言处理的能力,适用于构建富有同情心的聊天机器人、心理健康工具、社交媒体分析器等。数据集文件大小为7.41MB,便于在边缘设备和大型项目中使用。
huggingface 收录
CODrone
CODrone 是一个为无人机设计的全面定向目标检测数据集,它准确反映了真实世界条件。该数据集包含来自多个城市在不同光照条件下的广泛标注图像,增强了基准的逼真度。CODrone 包含超过 10,000 张高分辨率图像,捕获自五个城市的真实无人机飞行,涵盖了各种城市和工业环境,包括港口和码头。为了提高鲁棒性和泛化能力,它包括在正常光线、低光和夜间条件下相同场景的图像。我们采用了三种飞行高度和两种常用的相机角度,从而产生了六个不同的视角配置。所有图像都针对 12 个常见对象类别进行了定向边界框标注,总计超过 590,000 个标记实例。总体而言,这项工作构建了一个综合数据集和基准,用于城市无人机场景中的定向目标检测,旨在满足该领域的研究和实践应用需求。
arXiv 收录
VEDAI
用于训练YOLO模型的VEDAI数据集,包含图像和标签,用于目标检测和跟踪。
github 收录
