five

SH17 Dataset|制造业安全数据集|个体防护装备检测数据集

收藏
github2024-07-08 更新2024-07-09 收录
制造业安全
个体防护装备检测
下载链接:
https://github.com/ahmadmughees/SH17dataset
下载链接
链接失效反馈
资源简介:
SH17数据集用于制造业中的人类安全和个体防护装备检测,包含8,099张标注图像,75,994个对象实例,涵盖17类PPE物品和身体部位,收集自全球多样化的工业环境。
创建时间:
2024-06-11
原始信息汇总

SH17数据集概述

数据集简介

SH17数据集专注于制造业中的人类安全和个体防护装备(PPE)检测。该数据集包含8,099张标注图像,涵盖75,994个对象实例,涉及17个PPE类别。数据集旨在通过对象检测(OD)和卷积神经网络(CNN)技术,验证和检测如头盔、安全眼镜、口罩和防护服等PPE的正确使用。

数据集详情

  • 图像数量: 8,099张
  • 对象实例: 75,994个
  • 类别数量: 17类
  • 类别列表:
    1. Person
    2. Head
    3. Face
    4. Glasses
    5. Face-mask-medical
    6. Face-guard
    7. Ear
    8. Earmuffs
    9. Hands
    10. Gloves
    11. Foot
    12. Shoes
    13. Safety-vest
    14. Tools
    15. Helmet
    16. Medical-suit
    17. Safety-suit

关键特性

  • 图像收集自全球多样化的工业环境。
  • 高质量图像,最大分辨率为8192x5462,最小为1920x1002。
  • 平均每张图像包含9.38个实例。
  • 包含小对象如耳朵和耳罩(39,764个标注小于图像面积的1%,59,025个标注小于图像面积的5%)。

模型训练与评估

数据集用于训练和验证多种YOLO模型(v8, v9, v10),使用ultralytics库进行模型训练。提供了各模型的训练权重和评估结果,其中YOLOv9-e模型在PPE检测中达到了超过70.9%的准确率。

使用许可

SH17数据集遵循CC BY-NC-SA 4.0许可协议,仅供教育、研究和分析目的使用。用户在使用数据时应遵守Pexels网站的版权声明,并确保使用数据的行为符合法律和道德规范。

AI搜集汇总
数据集介绍
main_image_url
构建方式
SH17数据集的构建基于对制造业环境中人类安全和个体防护装备(PPE)检测的需求。该数据集由8,099张经过标注的图像组成,涵盖了75,994个对象实例,涉及17种PPE物品和身体部位。这些图像从全球多样化的工业环境中采集,确保了数据集的广泛代表性。图像的分辨率范围从1920x1002到8192x5462,平均每张图像包含9.38个实例,包括如耳部和耳罩等小物体。数据集的构建过程严格遵循对象检测(OD)和卷积神经网络(CNN)的技术框架,旨在为训练和验证OD模型提供高质量的数据支持。
特点
SH17数据集的主要特点在于其广泛的应用场景和高度的细节捕捉。首先,数据集包含了从全球不同工业环境中采集的高质量图像,确保了训练模型的泛化能力。其次,数据集详细标注了17种PPE物品和身体部位,包括小至耳部和耳罩的物体,这些小物体在图像中的占比不到1%,但仍被精确标注,体现了数据集的细致程度。此外,数据集的平均实例密度为每张图像9.38个,确保了模型在处理复杂场景时的鲁棒性。这些特点使得SH17数据集成为研究和开发PPE检测技术的理想选择。
使用方法
使用SH17数据集进行模型训练和验证时,首先需要从Kaggle平台下载数据集,并使用提供的脚本将图像和标注文件整合。接着,用户可以利用ultralytics库中的YOLO模型进行训练,如YOLOv8、v9和v10等。训练过程中,可以通过调整模型参数和数据增强技术来优化模型性能。训练完成后,用户可以使用训练好的模型对新图像进行推理,并通过ultralytics库提供的接口查看和分析结果。此外,数据集还提供了详细的评估代码,用户可以利用这些代码在SH17验证集上复现基准测试结果,确保模型的准确性和可靠性。
背景与挑战
背景概述
在制造业等高风险行业中,工作场所事故对人类安全构成重大威胁,因此个人防护装备(PPE)的合规性变得尤为重要。SH17数据集由Ahmad和Rahimi于2024年创建,旨在通过基于对象检测(OD)和卷积神经网络(CNN)的非侵入性技术,检测和验证各种PPE的正确使用,如头盔、安全眼镜、口罩和防护服。该数据集包含8,099张标注图像,涵盖75,994个实例,涉及17个类别,从全球多样化的工业环境中收集。SH17数据集的推出,标志着在提升安全管理系统效率和可扩展性方面迈出了重要一步,为行业满足人类安全法规提供了有力支持。
当前挑战
SH17数据集在构建过程中面临多重挑战。首先,从全球多样化的工业环境中收集高质量图像,确保数据的广泛代表性,是一项艰巨任务。其次,数据集中包含大量小对象(如耳朵和耳罩),这些对象的检测难度较大,需要高精度的算法支持。此外,跨域数据集的模型验证也提出了新的挑战,要求模型在不同环境下保持稳定性能。这些挑战不仅推动了对象检测技术的发展,也为未来在复杂工业环境中的应用提供了宝贵的经验。
常用场景
经典使用场景
在制造业环境中,SH17数据集被广泛用于训练和验证个人防护设备(PPE)检测模型。通过该数据集,研究人员能够开发出高效的计算机视觉算法,以实时监测工人是否正确佩戴安全帽、护目镜、口罩等防护装备。这种应用不仅提升了工作场所的安全性,还为自动化安全管理系统提供了坚实的技术基础。
解决学术问题
SH17数据集解决了在制造业和建筑业中,如何通过非侵入性技术有效监测和确保工人佩戴个人防护设备(PPE)的学术难题。该数据集通过提供多样化的工业环境图像和详细的PPE标注,使得研究人员能够训练出高精度的对象检测模型,从而显著提升了安全管理系统的效率和可靠性。
衍生相关工作
基于SH17数据集,研究者们开发了多种先进的对象检测模型,如YOLOv8、YOLOv9和YOLOv10系列,这些模型在PPE检测任务中表现出色。此外,该数据集还激发了关于如何在不同工业环境中实现高效安全监测的研究,推动了计算机视觉技术在制造业安全管理中的应用和发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

FMA (Free Music Archive)

免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集

OpenDataLab 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Sleep

该数据集包含关于睡眠效率和持续时间的信息,每个条目代表一个独特的睡眠体验,并包括ID、年龄、性别、睡眠持续时间、睡眠效率、REM睡眠百分比、深度睡眠百分比、轻度睡眠百分比、觉醒次数、咖啡因消费、酒精消费和吸烟状况等列。

github 收录

PQAref

PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。

huggingface 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录