five

SafetyHelmetWearing-Dataset|安全帽检测数据集|图像识别数据集

收藏
github2020-07-28 更新2024-05-31 收录
安全帽检测
图像识别
下载链接:
https://github.com/hwanji/Safety-Helmet-Wearing-Dataset
下载链接
链接失效反馈
资源简介:
安全帽佩戴检测数据集,包含7581张图像,其中有9044个佩戴安全帽的人(正例)和111514个未佩戴安全帽的人(负例)。数据集中的正例对象来自谷歌或百度,并使用LabelImg手动标注。部分负例对象来自SCUT-HEAD数据集,我们对原始SCUT-HEAD数据集进行了一些修正,使其可以直接加载为标准的Pascal VOC格式。

The safety helmet wearing detection dataset comprises 7,581 images, including 9,044 instances of individuals wearing safety helmets (positive examples) and 111,514 instances of individuals not wearing safety helmets (negative examples). The positive examples in the dataset are sourced from Google or Baidu and are manually annotated using LabelImg. Some of the negative examples are derived from the SCUT-HEAD dataset, which we have modified to ensure it can be directly loaded in the standard Pascal VOC format.
创建时间:
2020-07-28
原始信息汇总

SafetyHelmetWearing-Dataset 概述

数据集简介

SafetyHelmetWearing-Dataset(SHWD)是一个用于安全帽佩戴和人类头部检测的数据集。该数据集包含7581张图像,其中9044个安全帽佩戴对象(正例)和111514个正常头部对象(未佩戴或负例)。正例对象来源于Google或Baidu,并通过LabelImg手动标注。部分负例对象来自SCUT-HEAD数据集,经过修复原数据集的错误后,以Pascal VOC格式直接加载。此外,数据集还提供了基于MXNet GluonCV的预训练模型。

数据集与模型下载

数据集格式

数据集标注为Pascal VOC格式,包含以下目录结构:

---VOC2028
---Annotations
---ImageSets
---JPEGImages

数据集定义了两个对象类别:“hat”(正例对象)和“person”(负例对象)。

使用方法

依赖项

确保安装了MXNet、GluonCV和OpenCV。

测试预训练模型

  • 第一种方式: 下载模型后,运行python test_yolo.py,可调整的选项包括网络类型、阈值、是否使用GPU及图像短边输入大小。
  • 第二种方式: 下载符号模型后,运行python test_symbol.py进行推理。

训练模型

train_yolo.py中设置数据集路径,例如:

train_dataset = VOCLike(root=D:VOCdevkit, splits=[(2028, trainval)]) val_dataset = VOCLike(root=D:VOCdevkit, splits=[(2028, test)])

然后根据需要设置训练选项,如批量大小、工作进程数和预热周期等。

注意事项

  • 训练YOLO模型时,注意避免梯度爆炸问题,可通过增加预热周期或减小学习率来解决。
  • 数据集加载可能占用大量CPU资源,增加工作进程数可提高训练速度。
  • 在Windows系统上训练时,程序可能会阻塞,需检查系统资源分配。
AI搜集汇总
数据集介绍
main_image_url
构建方式
SafetyHelmetWearing-Dataset(安全帽佩戴检测数据集)的构建基于7581张图像,包含9044个佩戴安全帽的正样本和111514个未佩戴安全帽的负样本。正样本主要通过谷歌和百度等平台获取,并使用LabelImg工具进行人工标注。负样本则部分来源于SCUT-HEAD数据集,经过修复和格式调整,使其符合Pascal VOC标准。数据集的标注格式与Pascal VOC一致,便于直接加载和使用。
使用方法
使用SafetyHelmetWearing-Dataset时,用户需确保安装MXNet、GluonCV和OpenCV等依赖库。数据集的标注文件位于VOC2028目录下,分为Annotations、ImageSets和JPEGImages三个子目录。用户可通过下载预训练模型进行推理,支持两种推理方式:直接运行test_yolo.py脚本或使用mxnet符号模型进行推理。训练时,用户需设置数据集路径,并根据需要调整训练参数,如批量大小和学习率等。
背景与挑战
背景概述
SafetyHelmetWearing-Dataset(安全帽佩戴检测数据集,SHWD)是由相关研究团队创建的,旨在解决安全帽佩戴检测与人体头部检测问题。该数据集包含了7581张图像,其中包含9044个佩戴安全帽的正样本和111514个未佩戴安全帽的负样本。数据集的正样本主要来源于谷歌和百度,并通过手动标注工具LabelImg进行标注;负样本则部分来源于SCUT-HEAD数据集,并对其进行了修复和格式调整,以符合Pascal VOC标准。此外,该数据集还提供了基于MXNet GluonCV的预训练模型,展示了其在实际应用中的潜力。
当前挑战
SafetyHelmetWearing-Dataset在构建过程中面临了多重挑战。首先,数据集的标注工作需要高度精确,以确保模型能够准确识别佩戴和未佩戴安全帽的样本。其次,数据集的多样性和平衡性也是一个挑战,因为需要确保正负样本的分布合理,以避免模型在特定场景下的偏差。此外,数据集的加载和处理速度在训练过程中也是一个关键问题,尤其是在大规模数据集上进行深度学习模型的训练时,如何优化数据加载和处理流程以提高训练效率也是一个重要的挑战。
常用场景
经典使用场景
SafetyHelmetWearing-Dataset(安全帽佩戴检测数据集)主要用于安全帽佩戴检测和人体头部检测任务。该数据集包含7581张图像,其中9044个正样本(佩戴安全帽的对象)和111514个负样本(未佩戴安全帽的头部对象)。通过该数据集,研究人员可以训练和评估模型,以实现对施工现场或其他高风险环境中工人是否佩戴安全帽的自动检测。
解决学术问题
该数据集解决了在工业安全领域中,如何通过计算机视觉技术自动检测工人是否佩戴安全帽的学术问题。这一问题的解决不仅提升了安全监控的效率,还为预防事故提供了技术支持。通过提供大规模标注数据和预训练模型,该数据集为相关研究提供了坚实的基础,推动了目标检测技术在实际应用中的发展。
实际应用
SafetyHelmetWearing-Dataset在实际应用中具有广泛的潜力,特别是在建筑工地、矿山、化工厂等高风险工作环境中。通过部署基于该数据集训练的检测系统,可以实时监控工人是否佩戴安全帽,从而有效减少因未佩戴安全帽而导致的事故。此外,该数据集还可用于开发智能监控系统,提升工作场所的安全管理水平。
数据集最近研究
最新研究方向
在工业安全和智能监控领域,SafetyHelmetWearing-Dataset(安全帽佩戴检测数据集)的最新研究方向主要集中在提升检测算法的精度和实时性。随着深度学习技术的不断进步,研究人员正致力于开发更高效的模型,以应对复杂场景下的安全帽佩戴检测任务。此外,数据集的多样性和标注质量的提升也成为研究热点,旨在增强模型在不同光照、角度和背景条件下的泛化能力。这些研究不仅推动了工业安全监控系统的智能化发展,也为相关政策的执行提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

WLASL, MSASL, NMFs-CSL, SLR500, Slovo, BOBSL, 27 Class Sign Language Dataset, AUTSL, BosphorusSign22k, GSL, LSA16, LSA64, Rendered Handpose Dataset, YouTube-ASL, LSFB-ISOL, ASLLVD, AASL, KArSL, BdSLImset, HaGRID, Phoenix-2014, Phoenix-2014T

该仓库收集了多种与手语识别和翻译相关的数据集,旨在为研究者、开发者和爱好者提供一个集中的资源。数据集包括不同类型(如RGB、深度、骨骼)和来自不同国家的数据,用于支持手语识别和翻译技术的研究。

github 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录