MERL-RAV Dataset|人脸识别数据集|头部姿态分析数据集
收藏MERL-RAV Dataset 概述
数据集内容
- 规模: 包含超过19,000张人脸图像,覆盖全范围头部姿态。
- 标注: 每张人脸图像手动标注68个地标点,并提供每个地标点的可见性信息(未遮挡、自遮挡或外部遮挡)。
- 来源: 由专业标注员标注,并由三菱电机研究实验室(MERL)的研究人员监督。
数据集结构
-
文件夹结构:
├── merl_rav_labels │ ├── frontal │ │ ├── testset │ │ └── trainset │ ├── left │ │ ├── testset │ │ └── trainset │ ├── lefthalf │ │ ├── testset │ │ └── trainset │ ├── right │ │ ├── testset │ │ └── trainset │ └── righthalf │ ├── testset │ └── trainset ├── aflw │ └── flickr │ ├── 0 │ ├── 2 │ └── 3 ├── common_functions.py ├── organize_merl_rav_using_aflw_and_our_labels.py
标注文件格式
- 地标点标注: 遵循300-W和Multi-PIE数据集的68地标点标注方案。
- 标注内容: 每个地标点的坐标值根据其遮挡类型(未遮挡、外部遮挡、自遮挡)有所不同。
- 未遮挡: 正坐标值
(x, y)
。 - 外部遮挡: 负坐标值
(-x, -y)
,表示估计位置。 - 自遮挡: 坐标值
(-1, -1)
,表示位置未估计。
- 未遮挡: 正坐标值
使用指南
- 引用: 使用此数据集时,请引用相关CVPR论文。
- 组织数据: 使用提供的脚本
organize_merl_rav_using_aflw_and_our_labels.py
来组织数据集,确保标签文件与图像文件正确对应。
特殊情况处理
- 多张人脸图像: 当一张图像包含多个人脸时,标签和图像文件名会附加索引(如
_1
,_2
)以区分不同的人脸。

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录