five

DigiFace-1M, LFW, ADE20K, Body Parts, Geo Fossils-I, HumanWrist, Music Instruments, Landscape color and gray, Color Dataset, Hand Gestures

收藏
github2023-12-30 更新2024-05-31 收录
下载链接:
https://github.com/Jaramilloh/Face-Detector
下载链接
链接失效反馈
官方服务:
资源简介:
本仓库使用了多个数据集来训练和验证人脸检测神经网络,包括由Microsoft创建的包含100万合成人脸的DigiFace-1M数据集,由马萨诸塞大学阿默斯特分校提供的LFW数据集,以及用于训练非人脸的多个数据集,如ADE20K、Body Parts、Geo Fossils-I等。

This repository utilizes multiple datasets for training and validating face detection neural networks. These include the DigiFace-1M dataset, which contains 1 million synthetic faces created by Microsoft, the LFW dataset provided by the University of Massachusetts Amherst, and several datasets for training non-face images, such as ADE20K, Body Parts, and Geo Fossils-I.
创建时间:
2023-12-30
原始信息汇总

数据集概述

训练数据集

  • Faces:
    • 来源: 部分DigiFace-1M数据集,包含100万合成人脸图像。
    • 来源: LFW数据集,由University of Massachusetts Amherst提供。
  • Non-Faces:

数据集分布

  • Training:
    • Faces: 307,245
    • Non-faces: 716,035
  • Validation:
    • Faces: 25,128
    • Non-faces: 25,312

数据增强

  • 应用以下数据增强技术:
    • 图像下采样至32x32像素。
    • 随机亮度与对比度变化。
    • 随机伽马校正。
    • 随机区域丢弃。
    • 随机仿射变换:平移、旋转、缩放。
    • 随机水平翻转。
    • 标准化处理,使用均值(0.485, 0.456, 0.406)和标准差(0.229, 0.224, 0.225)。

验证结果

  • F1 Metric Results on the Validation Set:

    • Face Precision: 0.999
    • Face Recall: 0.991
    • Face F1-Score: 0.995
    • Non-face Precision: 0.991
    • Non-face Recall: 0.999
    • Non-face F1-Score: 0.995
    • Accuracy: 0.995
    • Macro Avg Precision: 0.995
    • Macro Avg Recall: 0.995
    • Macro Avg F1-Score: 0.995
  • True Positive Rate (FPR) and False Negative Rate (FNR) on the Validation Set:

    • Face FPR: 0.001
    • Face FNR: 0.009
    • Non-face FPR: 0.009
    • Non-face FNR: 0.001
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建过程主要依赖于多个公开数据集的有效整合与处理。首先,从DigiFace-1M和LFW数据集中提取了人脸图像,分别作为训练和验证集。其次,从ADE20K、Body Parts、Geo Fossils-I等多个非人脸数据集中随机提取图像块,并通过递归下采样增加样本数量,确保人脸与非人脸数据的比例为30%-70%。此外,所有训练图像均通过Albumentation库进行数据增强,包括下采样、亮度对比度调整、伽马校正等操作,以提升模型的泛化能力。
使用方法
该数据集的使用方法主要包括训练、验证和推理三个步骤。在训练阶段,模型通过卷积神经网络架构进行训练,输入图像大小为33x33x3像素,并通过数据增强技术提升模型的泛化能力。在验证阶段,模型在独立的验证集上进行评估,使用F1分数、准确率等指标衡量其性能。在推理阶段,模型通过提取图像窗口、下采样、标准化等步骤进行人脸检测,并结合非极大值抑制技术生成最终的人脸边界框。用户可以通过提供的脚本进行推理,输入图像后输出检测结果,并保存为新的图像文件。
背景与挑战
背景概述
DigiFace-1M数据集由微软于2023年推出,旨在为面部识别研究提供大规模的合成人脸图像资源。该数据集包含100万张数字生成的人脸图像,涵盖了多样化的面部特征和表情,极大地丰富了面部识别领域的训练数据。DigiFace-1M的创建标志着合成数据在计算机视觉中的重要性日益提升,尤其是在数据隐私和多样性需求日益增长的背景下。该数据集与LFW等传统人脸数据集相辅相成,为研究人员提供了更广泛的数据选择,推动了面部识别技术的进一步发展。
当前挑战
DigiFace-1M数据集在构建和应用中面临多重挑战。首先,尽管合成数据能够有效缓解隐私问题,但其与真实人脸图像的分布差异可能导致模型在实际场景中的泛化能力不足。其次,生成高质量且多样化的合成人脸图像需要复杂的算法和计算资源,这对数据集的构建提出了较高的技术要求。此外,如何确保合成数据的多样性和代表性,以避免模型在特定群体或场景中的偏差,也是一个亟待解决的问题。最后,将DigiFace-1M与其他数据集(如非人脸数据集)结合使用时,如何平衡数据分布并优化模型性能,仍需进一步探索。
常用场景
经典使用场景
在计算机视觉领域,DigiFace-1M和LFW数据集被广泛用于人脸检测和识别任务。这些数据集通过提供大量的人脸图像,帮助研究人员训练和验证神经网络模型,特别是在无约束环境下的面部识别。通过结合非人脸数据集如ADE20K和Body Parts,模型能够更准确地识别和区分人脸与非人脸区域,从而提高检测的精确度和鲁棒性。
解决学术问题
DigiFace-1M和LFW数据集解决了人脸识别中的关键问题,如在不同光照、姿态和表情下的识别准确性。这些数据集通过提供多样化的样本,帮助研究人员克服了传统方法在复杂场景下的局限性。此外,结合非人脸数据集的使用,进一步提升了模型在区分人脸与非人脸区域时的性能,减少了误检和漏检的情况。
实际应用
在实际应用中,DigiFace-1M和LFW数据集被广泛应用于安全监控、身份验证和社交媒体分析等领域。例如,在安全监控系统中,这些数据集训练的模型能够实时检测和识别监控视频中的人脸,帮助识别可疑人员。在社交媒体平台上,人脸识别技术可以用于自动标记照片中的人物,提升用户体验。
数据集最近研究
最新研究方向
在计算机视觉领域,人脸检测技术一直是研究的热点之一。近年来,随着深度学习技术的快速发展,基于神经网络的人脸检测方法取得了显著进展。DigiFace-1M和LFW等数据集在这一领域中扮演了重要角色,尤其是在训练和验证人脸检测模型时提供了丰富的样本资源。当前的研究方向主要集中在提高模型的鲁棒性和泛化能力,特别是在复杂背景和光照条件下的表现。通过引入多任务学习、数据增强技术以及更高效的网络架构,研究者们致力于减少误检率和漏检率,进一步提升检测精度。此外,结合迁移学习和自监督学习等前沿技术,探索在有限标注数据下的高效训练方法,也是当前研究的重要趋势。这些进展不仅推动了人脸检测技术的实际应用,也为相关领域如安防、人机交互等提供了强有力的技术支持。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务