Real-World Masked Face Dataset
收藏github2021-08-12 更新2024-05-31 收录
下载链接:
https://github.com/brightyoun/Real-World-Masked-Face-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
近期全球新型冠状病毒肆虐,疫情严重地区(如武汉)几乎人人戴口罩,具有海量样本基数。收集样本建立全球最大口罩人脸数据集,并向社会开放,为当前及今后可能的类似公共安全事件智能管控积累数据资源。基于口罩人脸数据,设计相应口罩遮挡人脸检测和识别算法,帮助社区封闭时的人员进出管控,车站、机场的人脸识别闸机以及人脸门禁考勤设备的升级,适应行人口罩蒙面遮挡的应用环境。
Recently, the global outbreak of the novel coronavirus has led to widespread mask-wearing, especially in severely affected areas such as Wuhan, providing a vast sample base. A dataset of the world's largest collection of masked facial images has been established and made publicly available to accumulate data resources for intelligent management of current and potential future public safety incidents. Based on this dataset, algorithms for detecting and recognizing faces with masks have been developed. These algorithms assist in managing access control in closed communities, upgrading facial recognition turnstiles at stations and airports, and adapting facial recognition attendance systems to environments where masks are commonly worn.
创建时间:
2020-04-01
原始信息汇总
数据集概述
数据集名称
- 口罩遮挡人脸数据集(Real-World Masked Face Dataset,RMFD)
发起单位
- 武汉大学国家多媒体软件工程技术研究中心
联系人及邮箱
- 联系人:熊张洋
- 联系邮箱:x_zhangyang@whu.edu.cn
数据集内容
-
真实口罩人脸识别数据集
- 样本来源:网络爬取
- 样本数量:525人,5千张口罩人脸,9万正常人脸
- 下载地址:
- 百度网盘 密码:j3aq
- Google Drive
-
模拟口罩人脸识别数据集
- 样本来源:公开数据集中的人脸戴上口罩
- 样本数量:1万人,50万张人脸
- 子数据集:
- WebFace模拟口罩人脸数据集
- 下载地址:
- 百度网盘 密码: 77m8
- Google Drive
- 下载地址:
- LFW模拟口罩人脸数据集
- 下载地址:
- 百度网盘 密码: o126
- Google Drive
- 下载地址:
- WebFace模拟口罩人脸数据集
数据集用途
- 设计和训练口罩遮挡人脸检测和识别算法
- 应用于社区封闭时的人员进出管控,车站、机场的人脸识别闸机以及人脸门禁考勤设备的升级
数据集性能
- 基于建立的数据集,设计和训练了面部-眉眼多粒度口罩人脸识别模型
- 数据集上的识别精度达到95%
数据集下载
- RMFD_part_1:可直接下载使用
- RMFD_part_2:需下载全部4个压缩文件后解压
- RMFD_part_3:需下载全部3个压缩文件后解压
- 下载地址:
- 百度网盘 提取码: xhze
- Google Drive
搜集汇总
数据集介绍

构建方式
该数据集的构建方式主要通过两种途径:一是从网络爬取真实戴口罩的人脸图像,经过整理、清洗和标注,形成包含525人的5千张口罩人脸和9万张正常人脸的真实口罩人脸识别数据集;二是通过给公开数据集中的人脸图像添加口罩,生成1万人、50万张人脸的模拟口罩人脸数据集。这两种方式共同构成了全球最大的口罩人脸数据集,为口罩遮挡人脸的检测和识别提供了丰富的数据资源。
特点
该数据集的显著特点在于其规模庞大且多样性丰富,涵盖了真实和模拟两种类型的口罩人脸图像。真实口罩人脸识别数据集包含525人的5千张口罩人脸和9万张正常人脸,而模拟口罩人脸数据集则通过给公开数据集添加口罩生成,包含1万人、50万张人脸。此外,数据集的标注精细,确保了同一人在戴口罩和未戴口罩状态下的图像配对,为口罩人脸识别算法的研究和应用提供了坚实的基础。
使用方法
该数据集可广泛应用于口罩遮挡人脸的检测和识别算法的开发与验证。用户可以通过提供的下载链接获取数据集,并根据需要选择真实或模拟口罩人脸数据集进行实验。数据集的多样性和规模使其适用于多种深度学习模型的训练和测试,尤其是在人脸识别技术需要适应口罩遮挡场景的应用中,如社区管控、车站和机场的人脸识别闸机等。
背景与挑战
背景概述
在全球新型冠状病毒疫情背景下,口罩佩戴成为普遍现象,尤其是在疫情严重的地区如武汉,几乎人人佩戴口罩。武汉大学国家多媒体软件工程技术研究中心发起并创建了全球最大的口罩遮挡人脸数据集(Real-World Masked Face Dataset,RMFD),旨在为未来可能的公共安全事件智能管控积累数据资源。该数据集不仅包含大量真实佩戴口罩的人脸图像,还通过模拟方式生成了大量佩戴口罩的人脸数据,以适应不同应用场景的需求。RMFD的建立为口罩遮挡人脸的检测与识别算法提供了丰富的训练数据,推动了社区管控、车站机场人脸识别闸机及人脸门禁考勤设备的升级,使其能够适应佩戴口罩的行人环境。
当前挑战
尽管RMFD数据集在口罩遮挡人脸识别领域具有重要意义,但其构建与应用仍面临诸多挑战。首先,数据集的多样性问题,即如何确保数据集中包含不同种族、年龄、性别及口罩类型的人脸图像,以提高算法的泛化能力。其次,数据标注的准确性与一致性,尤其是在同一人的多张戴口罩与未戴口罩图像的匹配上,需确保标注的精确性。此外,算法在实际应用中的鲁棒性,如在不同光照、角度及遮挡程度下的识别性能,也是亟待解决的问题。最后,数据隐私与安全问题,如何在数据收集与使用过程中保护个人隐私,确保数据集的合法性与伦理性,也是该领域面临的重要挑战。
常用场景
经典使用场景
在当前全球疫情背景下,Real-World Masked Face Dataset(RMFD)成为研究口罩遮挡人脸检测与识别的关键资源。该数据集广泛应用于设计与训练口罩人脸识别算法,特别是在社区封闭管理、车站与机场的人脸识别闸机以及人脸门禁考勤设备的升级中,确保这些系统能够在佩戴口罩的情况下依然高效运行。
解决学术问题
RMFD数据集有效解决了在口罩遮挡情况下人脸识别的学术难题,特别是在传统人脸识别算法因口罩遮挡而性能下降的问题。通过提供大量佩戴口罩与未佩戴口罩的同一人脸图像,该数据集为研究者提供了丰富的训练样本,推动了口罩人脸识别技术的快速发展,具有重要的学术价值和实际意义。
衍生相关工作
基于RMFD数据集,研究者们开发了多种口罩人脸识别算法,并在多个国际会议上发表了相关研究成果。例如,基于该数据集的多粒度口罩人脸识别模型在多个公开数据集上取得了显著的识别精度提升,推动了人脸识别技术在特殊环境下的应用。此外,该数据集还激发了关于如何在复杂环境下优化人脸识别算法的广泛讨论,促进了相关领域的技术进步。
以上内容由遇见数据集搜集并总结生成



