FDDB|人脸检测数据集|计算机视觉数据集
收藏FDDB_DataSet_4_faster_rcnn
数据集获取与处理步骤
步骤1: 获取数据
-
执行
./get_data.sh
脚本,下载originalPics.tar.gz
(~500MB) 和FDDB-folds.tgz
文件。 -
进行校验和测试,通过后解压至
originalPics
目录。 -
若下载链接失败,可从 FDDB 网站 手动下载。
-
若校验和始终失败,可使用以下命令手动下载并解压:
wget http://tamaraberg.com/faceDataset/originalPics.tar.gz wget http://vis-www.cs.umass.edu/fddb/FDDB-folds.tgz mkdir originalPics; tar -C originalPics -zxf originalPics.tar.gz tar -C originalPics -zxf FDDB-folds.tgz
步骤2: 数据集格式转换
- 执行
./generate_FDDB_2010.sh
脚本,将 FDDB 数据转换为适用于 pyfaster-rcnn 的格式。
数据集验证
- 使用 labelImg 工具验证数据集创建是否正确。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
MUStARD++
MUStARD++是一个多模态讽刺检测数据集,由萨里大学创建,旨在通过语言、语音和视觉线索全面捕捉讽刺现象。数据集包含1202个视频样本,来源于多个流行电视节目,通过手动标注确保高质量的讽刺标签。创建过程中,研究者们通过多轮标注和验证确保数据的准确性和多样性。该数据集主要应用于自动讽刺检测,帮助机器理解并识别讽刺语境,解决讽刺识别中的多模态挑战。
arXiv 收录
SuMeyYao/ysmpubmedclt
该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。
hugging_face 收录
Natural Scene Braille Character Recognition Dataset
There are a total of 1157 Braille segment images in this dataset, including 925 in the training set and 232 in the testing set. There are two folders in the directory of this dataset: character_label and segment_label. The character_rabel file contains three formats of Braille segment images: (1) Braille segment images and label files stored in ICDAR-2015 format, each. jpg file corresponds to a. txt file, where each line stores the position and recognition label of a braille character rectangle box. The data corresponds to the coordinates of the four points in the rectangle box and the recognized numerical label; (2) The original format of the data is stored in the folder org. Each .jpg file in this folder corresponds to a .json file which marked by labelme software; (3) VOC format, stored in voc-data folder. This folder stores images and corresponding .xml files in VOC format, and marks the position of each braille character rectangle box and its corresponding numerical label information in the .xml file. In addition, the original Braille images of natural scenes and the corresponding Braille segment markings .json files are stored in the folder segment_label.
DataCite Commons 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录