DigiFace-1M, LFW, ADE20K, Body Parts, Geo Fossils-I, HumanWrist, Music Instruments, Landscape color and gray, Color Dataset, Hand Gestures

github2023-12-30 更新2024-05-31 收录

下载链接：

https://github.com/Jaramilloh/Face-Detector

下载链接

链接失效反馈

官方服务：

资源简介：

本仓库使用了多个数据集来训练和验证人脸检测神经网络，包括由Microsoft创建的包含100万合成人脸的DigiFace-1M数据集，由马萨诸塞大学阿默斯特分校提供的LFW数据集，以及用于训练非人脸的多个数据集，如ADE20K、Body Parts、Geo Fossils-I等。

This repository utilizes multiple datasets for training and validating face detection neural networks. These include the DigiFace-1M dataset, which contains 1 million synthetic faces created by Microsoft, the LFW dataset provided by the University of Massachusetts Amherst, and several datasets for training non-face images, such as ADE20K, Body Parts, and Geo Fossils-I.

创建时间：

2023-12-30

原始信息汇总

数据集概述

训练数据集

Faces:
- 来源: 部分DigiFace-1M数据集，包含100万合成人脸图像。
- 来源: LFW数据集，由University of Massachusetts Amherst提供。
Non-Faces:
- 来源:
  - 部分ADE20K数据集，排除含有人物的场景。
  - Body Parts数据集，排除含面部部分的图像。
  - Geo Fossils-I数据集，包含合成化石图像。
  - HumanWrist数据集，包含人手腕图像。
  - Music Instruments数据集，包含乐器图像。
  - Landscape color and gray数据集，包含黑白及彩色风景图像。
  - Color Dataset数据集，包含彩色图像。
  - Hand Gestures数据集，包含自然场景中的手势图像。

数据集分布

Training:
- Faces: 307,245
- Non-faces: 716,035
Validation:
- Faces: 25,128
- Non-faces: 25,312

数据增强

应用以下数据增强技术：
- 图像下采样至32x32像素。
- 随机亮度与对比度变化。
- 随机伽马校正。
- 随机区域丢弃。
- 随机仿射变换：平移、旋转、缩放。
- 随机水平翻转。
- 标准化处理，使用均值(0.485, 0.456, 0.406)和标准差(0.229, 0.224, 0.225)。

验证结果

F1 Metric Results on the Validation Set:
- Face Precision: 0.999
- Face Recall: 0.991
- Face F1-Score: 0.995
- Non-face Precision: 0.991
- Non-face Recall: 0.999
- Non-face F1-Score: 0.995
- Accuracy: 0.995
- Macro Avg Precision: 0.995
- Macro Avg Recall: 0.995
- Macro Avg F1-Score: 0.995
True Positive Rate (FPR) and False Negative Rate (FNR) on the Validation Set:
- Face FPR: 0.001
- Face FNR: 0.009
- Non-face FPR: 0.009
- Non-face FNR: 0.001

搜集汇总

数据集介绍

构建方式

该数据集的构建过程主要依赖于多个公开数据集的有效整合与处理。首先，从DigiFace-1M和LFW数据集中提取了人脸图像，分别作为训练和验证集。其次，从ADE20K、Body Parts、Geo Fossils-I等多个非人脸数据集中随机提取图像块，并通过递归下采样增加样本数量，确保人脸与非人脸数据的比例为30%-70%。此外，所有训练图像均通过Albumentation库进行数据增强，包括下采样、亮度对比度调整、伽马校正等操作，以提升模型的泛化能力。

使用方法

该数据集的使用方法主要包括训练、验证和推理三个步骤。在训练阶段，模型通过卷积神经网络架构进行训练，输入图像大小为33x33x3像素，并通过数据增强技术提升模型的泛化能力。在验证阶段，模型在独立的验证集上进行评估，使用F1分数、准确率等指标衡量其性能。在推理阶段，模型通过提取图像窗口、下采样、标准化等步骤进行人脸检测，并结合非极大值抑制技术生成最终的人脸边界框。用户可以通过提供的脚本进行推理，输入图像后输出检测结果，并保存为新的图像文件。

背景与挑战

背景概述

DigiFace-1M数据集由微软于2023年推出，旨在为面部识别研究提供大规模的合成人脸图像资源。该数据集包含100万张数字生成的人脸图像，涵盖了多样化的面部特征和表情，极大地丰富了面部识别领域的训练数据。DigiFace-1M的创建标志着合成数据在计算机视觉中的重要性日益提升，尤其是在数据隐私和多样性需求日益增长的背景下。该数据集与LFW等传统人脸数据集相辅相成，为研究人员提供了更广泛的数据选择，推动了面部识别技术的进一步发展。

当前挑战

DigiFace-1M数据集在构建和应用中面临多重挑战。首先，尽管合成数据能够有效缓解隐私问题，但其与真实人脸图像的分布差异可能导致模型在实际场景中的泛化能力不足。其次，生成高质量且多样化的合成人脸图像需要复杂的算法和计算资源，这对数据集的构建提出了较高的技术要求。此外，如何确保合成数据的多样性和代表性，以避免模型在特定群体或场景中的偏差，也是一个亟待解决的问题。最后，将DigiFace-1M与其他数据集（如非人脸数据集）结合使用时，如何平衡数据分布并优化模型性能，仍需进一步探索。

常用场景

经典使用场景

在计算机视觉领域，DigiFace-1M和LFW数据集被广泛用于人脸检测和识别任务。这些数据集通过提供大量的人脸图像，帮助研究人员训练和验证神经网络模型，特别是在无约束环境下的面部识别。通过结合非人脸数据集如ADE20K和Body Parts，模型能够更准确地识别和区分人脸与非人脸区域，从而提高检测的精确度和鲁棒性。

解决学术问题

DigiFace-1M和LFW数据集解决了人脸识别中的关键问题，如在不同光照、姿态和表情下的识别准确性。这些数据集通过提供多样化的样本，帮助研究人员克服了传统方法在复杂场景下的局限性。此外，结合非人脸数据集的使用，进一步提升了模型在区分人脸与非人脸区域时的性能，减少了误检和漏检的情况。

实际应用

在实际应用中，DigiFace-1M和LFW数据集被广泛应用于安全监控、身份验证和社交媒体分析等领域。例如，在安全监控系统中，这些数据集训练的模型能够实时检测和识别监控视频中的人脸，帮助识别可疑人员。在社交媒体平台上，人脸识别技术可以用于自动标记照片中的人物，提升用户体验。

数据集最近研究