YawDD: Yawning Detection Dataset|驾驶员行为分析数据集|面部识别数据集

Mendeley Data2024-01-31 更新2024-06-29 收录

驾驶员行为分析

面部识别

下载链接：

https://ieee-dataport.org/open-access/yawdd-yawning-detection-dataset

下载链接

链接失效反馈

资源简介：

A dataset of videos, recorded by an in-car camera, of drivers in an actual car with various facial characteristics (male and female, with and without glasses/sunglasses, different ethnicities) talking, singing, being silent, and yawning. It can be used primarily to develop and test algorithms and models for yawning detection, but also recognition and tracking of face and mouth. The videos are taken in natural and varying illumination conditions. The videos come in two sets, as described next: In the first set, the camera is installed under the front mirror of the car. This set provides 322 videos, each for a different situation: 1- normal driving (no talking), 2- talking or singing while driving, and 3- yawning while driving. Each subject has 3 or 4 videos.In the second set, the camera is installed on the driver’s dash. This set provides 29 videos, one for each subject, and each video containing all of driving silently, driving while talking, and driving while yawning.

创建时间：

2024-01-31

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

THCHS-30

“THCHS30是由清华大学语音与语言技术中心（CSLT）发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下，由王东完成的。清华大学计算机科学系智能与系统，原名“TCMSD”，意思是“清华连续普通话语音数据库”，时隔13年出版，由王东博士发起，并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此，该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

SeaDronesSee

SeaDronesSee是由德国图宾根大学认知系统组创建的大型视觉对象检测和跟踪基准，专注于海洋环境中的人类检测。该数据集包含超过54,000帧，总计400,000个实例，从不同高度和视角（5至260米，0至90度）捕获，并提供详细的元信息。数据集的创建旨在填补陆基视觉系统与海基系统之间的差距，特别适用于无人机辅助的海上搜救任务。SeaDronesSee通过提供精确的元数据，如高度、视角和速度，支持多模态系统的开发，以提高检测的准确性和速度。此外，数据集还包括多光谱图像，利用非可见光谱（如近红外和红边光谱）来增强人类检测能力。

arXiv 收录

Asteroids by the Minor Planet Center

包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center，格式包括Fortran (.DAT)和JSON，数据集大小为81MB（压缩）和450MB（未压缩），记录数约750,000条，每日更新。

github 收录

CMNEE（Chinese Military News Event Extraction dataset）

CMNEE（Chinese Military News Event Extraction dataset）是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件，所有事件均基于预定义的军事领域模式人工标注，包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略，首先通过权威网站获取军事新闻文本并预处理，然后依据触发词字典进行预标注，经领域专家审核后形成事件模式。随后，通过人工分批、迭代标注并持续修正，直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集，对推动相关研究具有显著意义。

github 收录

MNLI

MNLI（Multi-Genre Natural Language Inference）是一个大规模的自然语言推理数据集，包含433,000多对句子对。该数据集用于评估模型在不同文本类型中的推理能力，包括新闻文章、小说、论坛帖子等。每个句子对都标注了三种可能的关系：蕴含（entailment）、矛盾（contradiction）和中性（neutral）。

cims.nyu.edu 收录