five

SafetyHelmetWearing-Dataset|安全帽检测数据集|图像识别数据集

收藏
github2020-04-19 更新2024-05-31 收录
安全帽检测
图像识别
下载链接:
https://github.com/RGuven/Safety-Helmet-Wearing-Dataset
下载链接
链接失效反馈
资源简介:
安全帽佩戴检测数据集(SHWD),用于安全帽佩戴和人体头部检测。包含7581张图像,其中有9044个佩戴安全帽的正样本和111514个未佩戴或负样本的头部对象。正样本来自谷歌或百度,并使用LabelImg手动标注。部分负样本来自SCUT-HEAD数据集,已修复原数据集的错误,并使其能直接加载为标准的Pascal VOC格式。

The Safety Helmet Wearing Detection Dataset (SHWD) is designed for the detection of safety helmet wearing and human heads. It comprises 7,581 images, including 9,044 positive samples of individuals wearing safety helmets and 111,514 negative samples of heads without helmets. The positive samples were sourced from Google or Baidu and were manually annotated using LabelImg. Some of the negative samples are derived from the SCUT-HEAD dataset, with corrections made to the original dataset's errors, enabling it to be directly loaded in the standard Pascal VOC format.
创建时间:
2020-04-19
原始信息汇总

安全帽佩戴检测数据集概述

数据集描述

  • 名称: SafetyHelmetWearing-Dataset (SHWD)
  • 用途: 用于安全帽佩戴和人类头部检测
  • 图像数量: 7581张
  • 标注对象:
    • 安全帽佩戴对象(正例): 9044个
    • 正常头部对象(未佩戴或负例): 111514个
  • 数据来源:
    • 正例对象来自Google或Baidu
    • 部分负例对象来自SCUT-HEAD数据集,经过修正以适应Pascal VOC格式
  • 标注工具: 使用LabelImg手动标注

数据集与模型下载

数据集格式

  • 标注格式: Pascal VOC格式
  • 对象类别:
    • "hat"(正例)
    • "person"(负例)

使用方法

  • 依赖: 需要安装MXNet, GluonCV, OpenCV
  • 测试:
    • 使用预训练模型进行推理,可通过命令行参数调整网络类型、置信度阈值、是否使用GPU及图像短边输入大小
  • 训练:
    • 设置数据集路径,使用train_yolo.py进行训练,可通过命令行参数调整批量大小、工作进程数和预热周期

注意事项

  • 训练问题:
    • 防止梯度爆炸,可尝试增加预热周期或降低学习率
    • 多核CPU可提高数据加载速度
    • 在Windows系统上训练时可能遇到程序阻塞问题,Linux系统需确保有足够的共享内存
AI搜集汇总
数据集介绍
main_image_url
构建方式
SafetyHelmetWearing-Dataset(安全帽佩戴检测数据集,SHWD)的构建过程严谨而细致。该数据集包含了7581张图像,其中9044个对象为佩戴安全帽的正样本,111514个对象为未佩戴安全帽的负样本。正样本主要通过谷歌和百度搜索引擎获取,并由人工使用LabelImg工具进行标注。负样本则来源于SCUT-HEAD数据集,经过修正后,确保其能够直接加载为标准的Pascal VOC格式。
特点
SHWD数据集的显著特点在于其样本的多样性和标注的精确性。数据集不仅涵盖了广泛的安全帽佩戴场景,还包含了大量的未佩戴安全帽的头部图像,确保了模型的泛化能力。此外,数据集提供了预训练模型,支持MXNet GluonCV框架,便于研究人员和开发者快速上手和应用。
使用方法
使用SHWD数据集时,首先需下载数据集并解压至指定路径,数据集以Pascal VOC格式组织,包含Annotations、ImageSets和JPEGImages三个主要文件夹。数据集支持两种对象类别:'hat'(正样本)和'person'(负样本)。用户可通过运行提供的Python脚本进行模型训练和测试,支持多种预训练模型,如darknet、mobile1.0和mobile0.25,并可根据需求调整参数如网络类型、置信度阈值和输入图像的短边尺寸。
背景与挑战
背景概述
在工业安全领域,安全帽的佩戴是保障工人生命安全的重要措施之一。SafetyHelmetWearing-Dataset(SHWD)数据集应运而生,旨在通过提供大规模的安全帽佩戴检测数据,推动相关技术的研究与发展。该数据集由7581张图像组成,包含9044个佩戴安全帽的正样本和111514个未佩戴安全帽的负样本。数据集的构建过程中,正样本主要来源于谷歌和百度,并通过人工标注工具LabelImg进行标注;负样本则部分来源于SCUT-HEAD数据集,并进行了修正以符合Pascal VOC格式。SHWD数据集不仅为安全帽佩戴检测提供了丰富的数据资源,还提供了预训练模型,极大地促进了工业安全领域的技术进步。
当前挑战
尽管SHWD数据集在安全帽佩戴检测领域具有重要意义,但其构建和应用过程中仍面临诸多挑战。首先,数据集的标注工作量大且复杂,尤其是负样本的获取和修正,需要耗费大量人力和时间。其次,数据集的多样性和代表性问题,如何确保数据集能够覆盖各种实际场景中的安全帽佩戴情况,是一个亟待解决的问题。此外,数据集的训练和测试过程中,如何有效避免梯度爆炸等常见问题,以及如何优化数据加载速度,都是研究人员需要面对的技术挑战。最后,数据集的推广和应用,如何在实际工业环境中验证其有效性和可靠性,也是一项重要的任务。
常用场景
经典使用场景
在工业安全领域,SafetyHelmetWearing-Dataset(安全帽佩戴检测数据集)被广泛用于训练和评估安全帽佩戴检测模型。该数据集包含7581张图像,其中9044个对象为佩戴安全帽的正样本,111514个对象为未佩戴安全帽的负样本。通过这些数据,研究人员可以开发出高效的安全帽佩戴检测算法,以确保工人在危险环境中的安全。
实际应用
在实际应用中,SafetyHelmetWearing-Dataset被用于开发和部署安全帽佩戴检测系统,广泛应用于建筑工地、矿山、工厂等高风险工作环境。这些系统能够实时监控工人的安全帽佩戴情况,及时发出警报,从而有效预防事故发生,保障工人的生命安全。
衍生相关工作
基于SafetyHelmetWearing-Dataset,许多研究工作得以展开,包括但不限于改进目标检测算法、优化模型性能、以及开发新的深度学习模型。例如,一些研究者利用该数据集训练了更高效的YOLO模型,提升了检测速度和精度。此外,该数据集还激发了在其他安全相关领域的研究,如防护服检测、危险区域监控等。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CosyVoice 2

CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。

arXiv 收录

CHARLS

中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。

charls.pku.edu.cn 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录