five

COVID19 Mask Image Dataset

收藏
github2023-06-28 更新2024-05-31 收录
下载链接:
https://github.com/UniversalDataTool/coronavirus-mask-image-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
来自Instagram的图像数据集,包含人们佩戴医疗口罩、非医疗(DIY)口罩或不戴口罩的图片。该数据集用于帮助人们针对COVID-19问题提出创造性解决方案,目前包含约1,205张图片样本。

An image dataset sourced from Instagram, containing images of people wearing medical masks, non-medical (DIY) masks, or no masks. This dataset is intended to help people develop creative solutions for COVID-19-related issues, and currently includes approximately 1,205 image samples.
创建时间:
2020-04-09
原始信息汇总

COVID19口罩图像数据集

数据集描述

该数据集包含来自Instagram的图像,展示了人们佩戴医用口罩、非医用(DIY)口罩或未佩戴口罩的情况。数据集由Universal Data Tool创建,旨在帮助人们针对COVID-19问题提出创新解决方案。目前数据集包含约1,205个图像样本。

数据集用途

该数据集可用于构建针对自拍类型照片的口罩检测器。

数据获取

数据集文件为mask_labels.udt.csv,可通过以下链接下载: 下载mask_labels.udt.csv

文件内容示例如下:

path . imageUrl output
samples.0 . https://example.com/image1.jpg medical_mask
samples.1 . https://example.com/image2.jpg no_mask
samples.2 . https://example.com/image3.jpg non_medical_mask

数据查看

下载mask_labels.udt.csv文件后,可在universaldatatool.com上打开查看。

数据使用

参考FastAI分类模型笔记本,了解如何使用该数据集与fast.ai框架。也可下载mask_labels.udt.csv文件,使用其他框架进行处理。

数据集性能

使用该数据集,我们实现了93%的预测准确率(参见混淆矩阵):

混淆矩阵

搜集汇总
数据集介绍
main_image_url
构建方式
COVID19 Mask Image Dataset的构建依托于Instagram平台上的公开图像资源,通过Universal Data Tool工具进行数据采集与标注。数据集包含了人们佩戴医用口罩、非医用口罩以及未佩戴口罩的自拍照片,总计约1,205张图像样本。这些图像通过URL链接的形式存储,并未直接托管于GitHub仓库中,确保了数据的实时性与多样性。
特点
该数据集的核心特点在于其专注于COVID-19疫情期间口罩佩戴行为的图像记录,涵盖了医用口罩、非医用口罩以及未佩戴口罩的多种场景。数据集的图像来源于真实的自拍照片,具有较强的现实意义和应用价值。此外,数据集的标注信息清晰,便于机器学习模型的训练与验证,为口罩检测算法的开发提供了高质量的数据支持。
使用方法
用户可通过下载mask_labels.udt.csv文件获取数据集的标注信息,并利用Universal Data Tool平台进行数据查看与处理。数据集适用于多种机器学习框架,例如fast.ai,用户可参考提供的Jupyter Notebook示例进行模型训练与验证。通过该数据集,开发者能够构建高精度的口罩检测模型,为疫情防控提供技术支持。
背景与挑战
背景概述
COVID19 Mask Image Dataset 是一个专注于COVID-19疫情期间口罩佩戴情况的图像数据集,由Universal Data Tool团队于2020年创建。该数据集包含了约1,205张来自Instagram的自拍照片,涵盖了佩戴医用口罩、非医用口罩以及未佩戴口罩的三种情况。其主要目的是为研究人员和开发者提供一个基础数据集,用于构建和训练能够检测自拍照片中口罩佩戴情况的模型。该数据集的发布为COVID-19相关研究提供了重要的数据支持,尤其是在公共卫生监测和自动化口罩检测领域具有广泛的应用潜力。
当前挑战
COVID19 Mask Image Dataset 在解决口罩检测问题时面临多重挑战。首先,数据集的样本量相对较小,仅有约1,205张图像,这可能导致模型训练时的泛化能力不足。其次,由于数据来源于Instagram,图像的质量和拍摄条件存在较大差异,如光照、角度和背景复杂度等,这些因素增加了模型训练的难度。此外,数据集中包含的口罩类型较为有限,主要集中在医用和非医用口罩上,缺乏对更多类型口罩的覆盖,限制了模型的适用性。最后,数据集的构建依赖于外部平台的链接,Instagram链接的失效问题可能导致数据获取的不稳定性,进一步影响研究的可重复性。
常用场景
经典使用场景
COVID19 Mask Image Dataset 数据集主要用于开发和训练面部口罩检测模型。该数据集包含了人们在自拍照片中佩戴医用口罩、非医用口罩或未佩戴口罩的图像,适用于构建基于深度学习的图像分类模型。通过该数据集,研究人员可以训练模型以识别不同类别的口罩佩戴情况,从而为公共卫生管理提供技术支持。
解决学术问题
该数据集解决了在COVID-19疫情期间如何快速、准确地检测口罩佩戴情况的学术问题。通过提供大量标注清晰的图像数据,研究人员能够开发出高效的口罩检测算法,从而为疫情防控提供科学依据。此外,该数据集还为研究口罩佩戴行为的模式及其对公共卫生的影响提供了数据支持。
衍生相关工作
基于 COVID19 Mask Image Dataset 数据集,许多经典研究工作得以展开。例如,研究人员利用该数据集开发了基于卷积神经网络(CNN)的口罩检测模型,并在公开竞赛中取得了优异的成绩。此外,该数据集还催生了一系列关于口罩佩戴行为分析的研究,进一步推动了计算机视觉技术在公共卫生领域的应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作