five

Kai1014/facemask-kaggle

收藏
Hugging Face2024-03-29 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Kai1014/facemask-kaggle
下载链接
链接失效反馈
官方服务:
资源简介:
Face Mask Detection数据集是一个用于图像分类任务的数据集,主要包含人类活动的图像。数据集分为15个类别,包括calling、clapping、cycling、dancing、drinking、eating、fighting、hugging、laughing、listeningtomusic、running、sitting、sleeping、texting和using_laptop。数据字段包括图像和标签,标签映射为三种类型:mask_weared_incorrect、with_mask和without_mask。数据集包含1500个训练样本、180个测试样本和180个验证样本,总大小为92.8 MiB。

Face Mask Detection数据集是一个用于图像分类任务的数据集,主要包含人类活动的图像。数据集分为15个类别,包括calling、clapping、cycling、dancing、drinking、eating、fighting、hugging、laughing、listeningtomusic、running、sitting、sleeping、texting和using_laptop。数据字段包括图像和标签,标签映射为三种类型:mask_weared_incorrect、with_mask和without_mask。数据集包含1500个训练样本、180个测试样本和180个验证样本,总大小为92.8 MiB。
提供机构:
Kai1014
原始信息汇总

数据集概述

  • 名称: Face Mask Detection
  • 语言: 英文
  • 许可证: ODbl
  • 美观名称: Face Mask Detection
  • 大小类别: 1K<n<10K
  • 源数据集: 原始数据集
  • 任务类别: 图像分类

数据集详细信息

文件结构

  • Train: 包含用于训练模型的所有图像,分为15个子文件夹,分别对应不同的活动。
  • Test: 包含5400张人类活动图像,需预测对应的类别。
  • Testing_set.csv: 预测提交顺序的CSV文件。
  • sample_submission: 数据冲刺的样本提交CSV文件。

数据字段

  • image: 包含图像的PIL.Image.Image对象。
  • labels: 分类标签,int类型。

类别标签映射

{ mask_weared_incorrect: 0, with_mask: 1, without_mask: 2 }

数据分割

train test validation
# of examples 1500 180 180

数据大小

  • 下载: 46 MiB
  • 生成: 46.8 MiB
  • 总计: 92.8 MiB
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,面部遮挡物的识别对于公共卫生监测具有重要意义。该数据集源自Kaggle平台,原始数据由Dphi技术社区提供,旨在支持口罩佩戴检测任务。构建过程涉及从公开渠道收集图像,并依据口罩佩戴状态进行人工标注,最终形成包含三类标签的结构化数据集。数据经过清洗与标准化处理,确保图像质量与标注一致性,为模型训练提供可靠基础。
使用方法
利用Hugging Face的datasets库,用户可通过load_dataset函数便捷加载该数据集。加载后,数据以DatasetDict形式呈现,包含train、validation和test三个子集,每个实例由图像对象和整型标签构成。建议在访问图像列时优先索引样本,以优化解码效率。数据集适用于图像分类模型的训练与评估,可直接嵌入PyTorch或TensorFlow等深度学习框架进行端到端开发。
背景与挑战
背景概述
在公共卫生事件频发的时代背景下,人脸口罩检测技术成为计算机视觉领域的重要研究方向。Kai1014/facemask-kaggle数据集应运而生,源自Kaggle平台,由数据科学社区贡献者Vijaykumar1799于2020年左右整理发布。该数据集聚焦于口罩佩戴状态的智能识别,核心研究问题在于通过图像分类方法,精准区分'正确佩戴口罩'、'未佩戴口罩'及'错误佩戴口罩'三种情形。其构建顺应了全球疫情防控的迫切需求,为公共卫生监测、智能安防系统提供了关键数据支撑,推动了边缘计算与轻量化视觉模型的发展,在医疗辅助决策与公共安全领域产生了广泛影响力。
当前挑战
该数据集旨在解决复杂场景下口罩佩戴状态的自动化检测难题,其核心挑战体现在两方面:其一,在领域问题层面,模型需克服光照变化、人脸姿态多样性、遮挡干扰以及不同口罩类型带来的类内差异,同时兼顾实时性要求与嵌入式设备的算力限制;其二,在构建过程中,数据采集面临标注一致性难题,例如'错误佩戴口罩'的边界定义模糊,且原始数据存在类别不平衡现象,需通过增强策略提升小样本类别的表征能力。此外,跨场景泛化性不足亦是亟待突破的瓶颈,模型在真实世界复杂环境中的鲁棒性仍有待验证。
常用场景
经典使用场景
在计算机视觉领域,人脸口罩检测数据集为图像分类任务提供了关键资源。该数据集广泛应用于训练和评估深度学习模型,特别是卷积神经网络(CNN)和视觉Transformer架构,以识别图像中人物佩戴口罩的正确性、错误佩戴或未佩戴状态。通过精细标注的三类标签,研究者能够系统性地探索模型在复杂场景下的泛化能力与鲁棒性,为公共卫生监控系统的智能化奠定基础。
解决学术问题
该数据集有效解决了视觉识别中细粒度分类的挑战,尤其在应对遮挡、光照变化和姿态多样性等现实干扰因素方面提供了标准化基准。其意义在于推动了迁移学习、数据增强及小样本学习等前沿方法的发展,促进了模型可解释性与公平性研究,为突发公共卫生事件中的快速技术响应建立了可复现的学术范式。
实际应用
在实际部署中,该数据集支撑了智能安防系统、公共场所入口自动化筛查以及远程医疗监测等场景。例如,在机场、车站或医院入口,集成该数据集训练的模型可实现实时口罩佩戴合规性检测,辅助管理人员提升防控效率,同时降低人际接触风险。这类应用显著增强了社区级公共卫生管理的精准性与响应速度。
数据集最近研究
最新研究方向
在公共卫生监测领域,人脸口罩检测数据集已成为计算机视觉技术赋能疫情防控的关键资源。当前研究聚焦于提升模型在复杂现实场景下的鲁棒性与实时性,探索轻量化网络架构与多模态数据融合的前沿路径。热点事件如全球疫情反复与智能安防需求增长,推动了该数据集在边缘计算设备部署与隐私保护技术中的创新应用,其影响深远,不仅优化了公共卫生管理效率,也为行为识别与异常检测研究提供了重要基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作