mask-wearing recognition dataset

Name: mask-wearing recognition dataset
Creator: 中国联通
Published: 2022-10-17 10:42:24
License: 暂无描述

arXiv2022-10-17 更新2024-06-21 收录

下载链接：

https://github.com/huh30/OpenDatasets

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集名为mask-wearing recognition dataset，由中国联通创建，旨在通过精细化的数据集设计，提高口罩佩戴识别的准确性，减少误报率。数据集包含超过10000张来自75个不同实际应用场景的图像，涵盖了医院、学校等多种环境。创建过程中，数据集根据实际应用需求和数据特性，被细分为正样本、负样本和不确定样本三类。该数据集的应用领域主要集中在工业场景中，用于提升口罩识别系统的性能，解决因复杂场景导致的误报问题。

This dataset, named mask-wearing recognition dataset, was developed by China Unicom. It aims to improve the accuracy of mask-wearing recognition and reduce false alarm rates via refined dataset design. The dataset includes more than 10,000 images sourced from 75 distinct real-world application scenarios, covering various environments such as hospitals and schools. During the creation process, the dataset was divided into three categories—positive samples, negative samples, and uncertain samples—based on actual application requirements and data characteristics. Its primary application fields focus on industrial scenarios, where it is used to enhance the performance of mask recognition systems and address false alarm issues caused by complex environments.

提供机构：

中国联通

创建时间：

2022-09-20

搜集汇总

数据集介绍

构建方式

在构建口罩佩戴识别数据集时，研究团队从75个实际应用场景中收集数据，包括医院、社区、学校等，通过现有的头部检测器提取头部图像，最终构建了超过10,000张口罩佩戴识别图像。这些图像涵盖了不同角度、光照、尺寸和质量的佩戴和不佩戴口罩的头部图像。数据集通过多轮人工标注，根据主流数据集构建方法分为正样本和负样本。此外，研究团队还根据数据特征和应用需求，将易导致误报的样本（如不规则佩戴、低质量图像、类似口罩的遮挡物）分类为不确定类别，形成最终的训练集。

使用方法

使用该数据集时，研究人员可以利用其精细分类的特性，训练出具有高识别精度和低误报率的模型。通过将数据集分为正样本、负样本和不确定类别，模型能够更好地处理复杂场景中的识别任务。此外，数据集的开源性质使得研究社区能够广泛应用和进一步优化该数据集，推动口罩佩戴识别技术的发展。

背景与挑战

背景概述

随着深度学习技术在工业场景中的广泛应用，如何降低误报率（False Alarm, FA）成为了一个亟待解决的问题。传统的网络架构优化和参数调整方法虽然在学术界占据主导地位，但往往忽视了应用场景中数据的基本特征，导致在新场景中误报率增加。为此，中国联通的研究团队提出了一种基于工业应用驱动的细粒度数据集设计新范式。该方法根据数据和应用需求灵活选择正负样本集，并将剩余样本作为不确定样本集加入训练集，最终形成至少包含三类样本的数据集。以口罩佩戴检测为例，研究团队收集了超过10,000张涵盖多种应用场景的口罩佩戴识别样本，实验结果表明，与传统数据集设计方法相比，该方法显著降低了误报率，并有望成为一种新的数据中心AI范式。

当前挑战

在构建口罩佩戴识别数据集的过程中，主要面临的挑战包括：1) 数据集的细粒度设计，即如何根据实际应用场景和数据特征灵活划分正负样本集及不确定样本集；2) 复杂场景下的数据采集，如不同光照、角度和姿态下的口罩佩戴情况，这些因素增加了数据集的构建难度；3) 误报率的降低，特别是在处理不规则佩戴、低质量和类似口罩遮挡的样本时，模型容易产生误报。这些挑战不仅影响了数据集的质量，也直接关系到模型在实际应用中的表现。

常用场景

经典使用场景

在计算机视觉领域，口罩佩戴识别数据集被广泛应用于开发和优化口罩检测算法。该数据集通过收集超过10,000张涵盖多种应用场景的口罩佩戴图像，为研究人员提供了一个丰富的资源库。经典的使用场景包括但不限于：在医院、学校、办公室等公共场所中，通过摄像头实时监控和识别人员的口罩佩戴情况，以确保公共卫生安全。此外，该数据集还可用于训练和验证深度学习模型，以提高口罩佩戴检测的准确性和鲁棒性。

解决学术问题

口罩佩戴识别数据集解决了在实际应用中高误报率（False Alarm Rate, FAR）的问题。传统的数据集设计方法往往忽视了数据本身的特性和实际应用场景的需求，导致在新场景中模型的误报率增加。该数据集通过精细设计，将数据分为正样本、负样本和不确定样本三类，有效降低了模型的误报率。这一方法不仅提升了口罩佩戴检测的准确性，还为其他类似的应用场景提供了新的数据集设计范式，具有重要的学术研究价值和实际应用意义。

实际应用

在实际应用中，口罩佩戴识别数据集被广泛应用于各种需要监控口罩佩戴情况的场景。例如，在疫情期间，医院、机场、学校等公共场所通过部署基于该数据集训练的口罩检测系统，实时监控人员的口罩佩戴情况，确保公共卫生安全。此外，该数据集还可用于工业生产中的安全监控，如在工厂中监控工人是否佩戴安全帽和手套，以防止工伤事故的发生。通过这些实际应用，该数据集不仅提升了公共安全，还推动了相关技术的产业化进程。

数据集最近研究