WIDER FACE, NIST-provided (IJB-B + FRVT), AFW, 300-W, MALF, FDDB, VGGFace, VGGFace2, MEMPO, LS3D-W
收藏github2024-05-01 更新2024-05-31 收录
下载链接:
https://github.com/blancaag/face-datasets
下载链接
链接失效反馈官方服务:
资源简介:
WIDER FACE是一个用于无约束人脸检测研究的数据集。NIST-provided (IJB-B + FRVT)定义了八个挑战,包括验证、识别、检测、聚类和处理拥挤图像。AFW是一个面部数据库。300-W结合了LFPW、AFW、HELEN和IBUG数据集。MALF是一个多姿态人脸验证数据集。FDDB是一个用于无约束人脸检测的数据集。VGGFace包含大量面部图像。VGGFace2包含3.31百万张图像,涵盖广泛的变化。MEMPO用于评估3D面部地标定位算法。LS3D-W是一个大规模的3D面部对齐数据集。
WIDER FACE is a dataset designed for research in unconstrained face detection. The NIST-provided (IJB-B + FRVT) defines eight challenges, including verification, recognition, detection, clustering, and handling crowded images. AFW is a facial database. 300-W combines the LFPW, AFW, HELEN, and IBUG datasets. MALF is a multi-pose face verification dataset. FDDB is a dataset for unconstrained face detection. VGGFace contains a large number of facial images. VGGFace2 includes 3.31 million images, covering a wide range of variations. MEMPO is used for evaluating 3D facial landmark localization algorithms. LS3D-W is a large-scale 3D face alignment dataset.
创建时间:
2017-11-06
原始信息汇总
数据集概述
2D数据集
-
WIDER FACE
- 来源:http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/index.html
-
NIST-provided (IJB-B + FRVT (testing only))
- 描述:包含67000张人脸图像,7000个人脸视频,以及10000张非人脸图像,用于解决验证、识别、检测、聚类和处理拥挤图像的挑战。
- 来源:https://www.nist.gov/programs-projects/face-challenges
-
AFW
- 来源:http://www.ics.uci.edu/~xzhu/face/
-
300-W (LFPW + AFW + HELEN + IBUG)
- 来源:https://ibug.doc.ic.ac.uk/resources/300-W/
-
MALF
- 来源:http://www.cbsr.ia.ac.cn/faceevaluation/
-
FDDB (2009/10)
- 描述:用于无约束人脸检测研究的数据集,包含2845张图像中的5171个人脸标注。
- 来源:http://vis-www.cs.umass.edu/fddb/index.html
-
VGGFace
- 来源:http://www.robots.ox.ac.uk/~vgg/data/vgg_face/
-
VGGFace2
- 描述:包含3.31百万张图像,涉及9131个主题,每个主题平均有362.6张图像,涵盖了姿态、年龄、光照、种族和职业的大范围变化。
- 来源:http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/
3D数据集
-
MEMPO
- 描述:用于评估3D面部地标定位算法的数据集,提供84个地标。
- 来源:https://ibug.doc.ic.ac.uk/resources
-
LS3D-W
- 描述:使用自动方法在AFLW、300VW、300W和FDDB的图像上一致地标注了68个点的3D面部对齐数据集。
- 来源:https://www.adrianbulat.com/face-alignment
-
FLORENCE 3D/2D (acquired)
- 描述:包含高分辨率3D扫描和多种分辨率、条件和缩放级别的视频序列。
- 来源:https://www.micc.unifi.it/resources/datasets/florence-3d-faces/
-
FLORENCE superface
- 描述:包含低分辨率和高分辨率3D扫描,用于研究不同分辨率的3D面部识别解决方案。
- 来源:https://www.micc.unifi.it/resources/datasets/florence-superface/
-
DMCSv1 (Multimodal Biometric Database of 3D Face and Hand Scans)
- 描述:包含3D面部和手部扫描,用于研究和教育机构。
- 来源:http://biometrics.dmcs.pl/en/databases/dmcsv1
-
3D Mask Attack Database (3DMAD)
- 描述:用于生物识别(面部)欺骗的数据库,包含76500帧的17个人,记录了真实访问和欺骗攻击。
- 来源:https://www.idiap.ch/dataset/3dmad
-
EURECOM Kinect Face Dataset (EURECOM KFD)
- 描述:包含52人的多模态面部图像,捕捉了不同的面部表情、光照和遮挡条件。
- 来源:http://rgb-d.eurecom.fr/
-
PhotoFace: Face recognition using photometric stereo
- 描述:包含3187个会话的453个主题,捕捉了两次约六个月的记录期。
- 来源:http://www1.uwe.ac.uk/et/mvl/projects/facerecognition.aspx
-
UMB database of 3D occluded faces
- 描述:专注于面部遮挡的多模态(3D + 2D彩色图像)面部采集数据库。
- 来源:http://www.ivl.disco.unimib.it/minisites/umbdb//description.html
-
Texas 3D Face Recognition Database (Texas 3DFRD)
- 描述:包含1149对面部颜色和范围图像的105个成人主题,用于3D面部识别研究。
- 来源:http://live.ece.utexas.edu/research/texas3dfr/
-
The Basel Face Model (BFM)
- 描述:从100个男性和100个女性示例面部构建的3D可变形面部模型。
- 来源:http://faces.cs.unibas.ch/bfm/
-
The Bosphorus Database
- 描述:包含丰富的表情、系统化的姿态变化和不同类型的遮挡的3D面部数据库。
- 来源:http://bosphorus.ee.boun.edu.tr/register.aspx?returnurl=http%3a%2f%2fbosphorus.ee.boun.edu.tr%2fhowtoobtain.aspx
-
BJUT-3D Chinese Face Database
- 描述:包含500个中国人的三维面部数据库,每个个体都有中性表情和无配件的3D面部数据。
- 来源:[研究访问]
-
FRAV3D Database
- 描述:包含106个主题,使用Minolta VIVID 700扫描仪获取的数据,提供2D图像和3D图像。
- 来源:[研究访问]
搜集汇总
数据集介绍

构建方式
该数据集集合了多个面部识别领域的经典数据集,涵盖了2D和3D面部图像。其构建方式主要通过整合来自不同来源的面部图像和视频数据,包括WIDER FACE、NIST-provided (IJB-B + FRVT)、AFW、300-W、MALF、FDDB、VGGFace、VGGFace2、MEMPO和LS3D-W等。这些数据集通过不同的采集技术和标注方法,确保了数据的多维度性和多样性。例如,WIDER FACE通过大规模的面部检测数据集,提供了丰富的面部图像;VGGFace2则通过从谷歌图片搜索中获取的大量图像,涵盖了多种姿态、年龄、光照和种族的面部图像。
特点
该数据集的特点在于其广泛性和多样性。首先,数据集包含了从2D到3D的多种面部图像,涵盖了不同的采集环境和条件,如光照、姿态、表情和遮挡等。其次,数据集的规模庞大,例如VGGFace2包含了331万张图像,涉及9131个不同的身份,每个身份平均有362.6张图像。此外,数据集的标注精细,部分数据集提供了详细的面部关键点标注和3D模型参数,适用于多种面部识别和分析任务。
使用方法
该数据集适用于多种面部识别和分析任务,包括面部检测、面部验证、面部识别、面部关键点定位和3D面部重建等。使用者可以根据具体任务选择合适的数据集进行训练和测试。例如,对于面部检测任务,可以选择WIDER FACE数据集;对于面部识别任务,可以选择VGGFace2数据集。此外,数据集的多样性使得其适用于跨种族、跨年龄和跨姿态的面部识别研究。使用时,建议参考各数据集的官方文档,了解数据格式和标注信息,以便进行有效的数据处理和模型训练。
背景与挑战
背景概述
面部识别技术在计算机视觉领域占据重要地位,其应用涵盖了安全监控、人机交互和生物识别等多个领域。WIDER FACE、NIST-provided (IJB-B + FRVT)、AFW、300-W、MALF、FDDB、VGGFace、VGGFace2、MEMPO、LS3D-W等数据集,均由全球知名研究机构和大学创建,旨在推动面部识别技术的研究与发展。这些数据集不仅包含了丰富的面部图像和视频数据,还涵盖了从2D到3D的多种数据类型,以模拟真实世界中的复杂场景。例如,WIDER FACE数据集由香港中文大学多媒体实验室创建,包含超过32,000张图像和80,000个面部标注,主要用于研究面部检测和识别。VGGFace2数据集则由牛津大学视觉几何组开发,包含330万张图像,覆盖了9131个不同身份,旨在研究面部识别中的姿态、年龄、种族和职业多样性。这些数据集的创建和发布,极大地推动了面部识别技术的进步,并为相关研究提供了宝贵的资源。
当前挑战
尽管这些面部识别数据集在推动技术进步方面发挥了重要作用,但它们也面临着诸多挑战。首先,面部识别技术在处理复杂背景、光照变化、遮挡和姿态变化等问题时仍存在困难。例如,WIDER FACE数据集中的图像背景复杂,面部区域可能被遮挡,这对检测算法的鲁棒性提出了高要求。其次,数据集的构建过程中也面临挑战,如数据标注的准确性和一致性问题。以300-W数据集为例,其标注过程涉及多个数据源的整合,确保标注的一致性和准确性是一个复杂的过程。此外,随着面部识别技术向3D和多模态方向发展,如何有效整合和利用2D和3D数据,以及如何处理多模态数据中的噪声和不一致性,也是当前研究面临的重要挑战。这些挑战不仅影响了数据集的质量,也限制了面部识别技术的实际应用效果。
常用场景
经典使用场景
在人脸识别与分析领域,WIDER FACE、NIST-provided (IJB-B + FRVT)、AFW、300-W、MALF、FDDB、VGGFace、VGGFace2、MEMPO、LS3D-W等数据集被广泛应用于人脸检测、识别、特征点定位等任务。这些数据集涵盖了从2D到3D的多种人脸数据,适用于不同光照、姿态、表情和遮挡条件下的研究。例如,WIDER FACE数据集因其包含大量复杂场景下的人脸图像,常用于人脸检测算法的评估;而VGGFace2则因其多样化的姿态、年龄和种族信息,被广泛用于人脸识别模型的训练与测试。
解决学术问题
这些数据集在解决人脸识别领域的关键学术问题中发挥了重要作用。例如,WIDER FACE数据集通过提供大量复杂场景下的人脸图像,解决了传统人脸检测算法在复杂背景、遮挡和光照变化下性能下降的问题。NIST-provided (IJB-B + FRVT)数据集则通过定义多种挑战任务,推动了人脸验证、识别和聚类算法的发展。此外,300-W数据集通过提供精确的面部特征点标注,解决了面部特征点定位中的精度问题,为人脸对齐和3D重建提供了基础数据支持。
衍生相关工作
基于这些数据集,研究者们开发了多种经典算法和模型。例如,基于WIDER FACE数据集的研究推动了多尺度人脸检测算法的发展;基于NIST-provided (IJB-B + FRVT)数据集的研究则提出了多种鲁棒的人脸验证和识别方法。此外,VGGFace2数据集的发布催生了大量关于深度学习在人脸识别中应用的研究,如基于卷积神经网络(CNN)的人脸识别模型。MEMPO和LS3D-W数据集则为3D面部特征点定位和面部表情分析提供了丰富的研究素材,推动了相关领域的技术进步。
以上内容由遇见数据集搜集并总结生成



