JAAD Dataset|行人检测数据集|交通行为分析数据集
收藏数据集概述
数据集名称
JAAD (Joint Attention in Autonomous Driving) Dataset
数据集目的
提供样本用于行人检测、行人动作和手势识别,以及交通参与者的行为研究。
数据集内容
- 视频数据:包含346个高分辨率视频片段(5-15秒),使用仪表盘安装的摄像头录制。
- 注释数据:
- 边界框(Bounding Boxes):超过39万个边界框,涵盖2793个独特行人,格式为vbb。
- 交通场景元素:提供
traffic_scene_elements.txt
文件,记录每个视频的场景元素及其对应的帧号。 - 行人属性:提供
pedestrian_attributes.txt
文件,记录686个与驾驶员互动的行人的详细属性。 - 行为注释:使用BORIS 2软件生成的行为数据,包括视频文件名、独立变量和时间戳观察。
数据集格式
- 视频格式:mp4和seq格式。
- 边界框格式:vbb格式,需使用Piotr Dollar的计算机视觉Matlab工具箱。
- 行为数据格式:BORIS tsv和xml格式。
数据集使用工具
- 视频到图像序列转换:使用
split_clips_to_frames.sh
脚本。 - Matlab中打开vbb文件:使用
vbbLoad
命令。 - Matlab中读取xml文件:使用
xml2struct.m
脚本。
数据集下载
所有视频序列可从项目网站下载:http://data.nvision2.eecs.yorku.ca/JAAD_dataset/

Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Wafer Defect
该数据集包含了七个主要类别的晶圆缺陷,分别是:BLOCK ETCH、COATING BAD、PARTICLE、PIQ PARTICLE、PO CONTAMINATION、SCRATCH和SEZ BURNT。这些类别涵盖了晶圆在生产过程中可能出现的多种缺陷类型,每一种缺陷都有其独特的成因和表现形式。数据集不仅在类别数量上具有多样性,而且在样本的多样性和复杂性上也展现了其广泛的应用潜力。每个类别的样本均经过精心标注,确保了数据的准确性和可靠性。
github 收录