Webface-OCC

Name: Webface-OCC
Creator: 多媒体软件国家工程研究中心，武汉大学计算机学院
Published: 2021-03-04 11:07:42
License: 暂无描述

arXiv2021-03-04 更新2024-06-21 收录

下载链接：

https://github.com/Baojin-Huang/Webface-OCC

下载链接

链接失效反馈

官方服务：

资源简介：

Webface-OCC是由多媒体软件国家工程研究中心和武汉大学计算机学院创建的一个大型人脸识别数据集，专注于解决人脸遮挡问题。该数据集包含804,704张人脸图像，涵盖10,575个不同个体，通过模拟多种遮挡类型（如眼镜和口罩）来增强数据集的多样性和真实性。创建过程中，研究团队首先收集了多种遮挡物，并通过随机组合其属性（如物体、纹理和颜色）来生成大量真实遮挡类型。数据集的应用领域主要集中在提高模型在实际场景中对遮挡人脸的识别能力，特别是在COVID-19疫情期间，口罩遮挡对人脸识别技术提出了新的挑战。

Webface-OCC is a large-scale face recognition dataset developed by the National Engineering Research Center for Multimedia Software and the School of Computer Science, Wuhan University, which focuses on addressing the problem of face occlusion. This dataset contains 804,704 face images covering 10,575 distinct individuals, and enhances its diversity and realism by simulating various occlusion types such as glasses and face masks. During the dataset construction, the research team first collected a variety of occluding objects, then generated a large number of realistic occlusion types by randomly combining their attributes including object category, texture and color. The dataset is mainly applied to improving the recognition performance of models for occluded faces in real-world scenarios, especially during the COVID-19 pandemic, when face mask occlusion posed new challenges to face recognition technologies.

提供机构：

多媒体软件国家工程研究中心，武汉大学计算机学院

创建时间：

2021-03-04

搜集汇总

数据集介绍

构建方式

在构建Webface-OCC数据集时，研究团队首先收集了多种眼镜和口罩作为遮挡物，并通过随机组合遮挡物的属性（如遮挡对象、纹理和颜色）来生成大量更为真实的遮挡类型。随后，这些遮挡物被合理地覆盖在人脸图像的适当位置，模拟正常的遮挡习惯。此外，团队还结合了原始的正常人脸图像和遮挡后的人脸图像，形成了最终的数据集。这一过程确保了数据集的多样性和稳定性，涵盖了804,704张人脸图像，涉及10,575个主体。

使用方法

Webface-OCC数据集适用于各种基于深度学习的人脸识别模型训练。研究者可以使用该数据集来训练和验证模型在遮挡情况下的识别性能。具体使用时，可以将数据集分为训练集和测试集，利用遮挡和正常人脸图像进行模型训练。通过对比不同模型在遮挡和非遮挡情况下的识别准确率，可以评估模型的鲁棒性和适应性。此外，数据集的多样性也使得其适用于多种遮挡场景下的模型优化和性能提升研究。

背景与挑战

背景概述

随着深度学习技术在人脸识别领域的快速发展，许多基于深度学习的人脸识别方法在正常场景下取得了令人瞩目的性能，甚至在基准数据集上超越了人类的识别能力。然而，在实际的无约束场景中，当人脸图像被遮挡时，识别准确率会急剧下降。为了消除遮挡对人脸识别准确率的影响，研究人员主要通过训练深度网络来‘熟悉’人脸图像的遮挡区域，从而减弱或修复遮挡成分。然而，目前尚无开源的遮挡人脸识别数据集。为了填补这一空白，黄宝金等人于2021年创建了Webface-OCC数据集，该数据集通过模拟多种遮挡类型（如眼镜和口罩）来生成大量更真实的遮挡人脸图像，涵盖了804,704张人脸图像，涉及10,575个主体。这一数据集的创建不仅解决了现有数据集缺乏遮挡样本的问题，还显著提升了遮挡场景下的人脸识别性能，对推动人脸识别技术在实际应用中的发展具有重要意义。

当前挑战

Webface-OCC数据集的构建面临多重挑战。首先，模拟遮挡的真实性和多样性是一个主要难题，研究人员需要确保遮挡类型和位置的合理性，以避免合成方法过于简单而无法适应实际识别需求。其次，数据集的构建过程中，如何平衡遮挡样本与正常样本的比例，确保数据集在正常人脸图像识别中的稳定性，也是一个重要挑战。此外，尽管该数据集在模拟遮挡人脸识别中表现出色，但在处理真实世界中的遮挡人脸时，识别准确率仍显著下降，这表明模拟数据与真实数据之间存在较大差距。未来，如何进一步提高数据集在真实遮挡场景下的适用性，将是该领域面临的主要挑战。

常用场景

经典使用场景

在人脸识别领域，Webface-OCC数据集因其对遮挡情况的全面模拟而成为经典。该数据集通过收集多种眼镜和口罩作为遮挡物，并随机组合这些遮挡物的属性（如物体、纹理和颜色），生成大量逼真的遮挡类型。这些遮挡物被合理地覆盖在人脸图像的适当位置，以模拟正常的遮挡习惯。这种细致的模拟使得Webface-OCC成为训练和评估遮挡人脸识别模型的理想选择。

解决学术问题

Webface-OCC数据集解决了传统人脸识别数据集中遮挡样本不足的问题，特别是在实际无约束场景中，人脸图像的遮挡导致识别准确率大幅下降。通过提供多样化和真实的遮挡样本，该数据集显著提升了遮挡人脸识别模型的性能，推动了相关领域的研究进展。其意义在于为研究人员提供了一个可靠的基准，以评估和改进遮挡人脸识别算法，从而在实际应用中实现更高的识别准确率。

实际应用

在实际应用中，Webface-OCC数据集在疫情期间尤为重要，因为佩戴口罩已成为防止病毒传播的有效手段。传统基于CNN的人脸识别模型在面对严重遮挡时几乎失效，而Webface-OCC通过提供大量遮挡人脸图像，使得模型能够更好地适应这种场景。此外，该数据集还可应用于安全监控、身份验证和访问控制等领域，特别是在需要处理遮挡人脸的场景中，显著提升了系统的鲁棒性和可靠性。

数据集最近研究