SH17 Dataset|制造业安全数据集|个体防护装备检测数据集
收藏SH17数据集概述
数据集简介
SH17数据集专注于制造业中的人类安全和个体防护装备(PPE)检测。该数据集包含8,099张标注图像,涵盖75,994个对象实例,涉及17个PPE类别。数据集旨在通过对象检测(OD)和卷积神经网络(CNN)技术,验证和检测如头盔、安全眼镜、口罩和防护服等PPE的正确使用。
数据集详情
- 图像数量: 8,099张
- 对象实例: 75,994个
- 类别数量: 17类
- 类别列表:
- Person
- Head
- Face
- Glasses
- Face-mask-medical
- Face-guard
- Ear
- Earmuffs
- Hands
- Gloves
- Foot
- Shoes
- Safety-vest
- Tools
- Helmet
- Medical-suit
- Safety-suit
关键特性
- 图像收集自全球多样化的工业环境。
- 高质量图像,最大分辨率为8192x5462,最小为1920x1002。
- 平均每张图像包含9.38个实例。
- 包含小对象如耳朵和耳罩(39,764个标注小于图像面积的1%,59,025个标注小于图像面积的5%)。
模型训练与评估
数据集用于训练和验证多种YOLO模型(v8, v9, v10),使用ultralytics库进行模型训练。提供了各模型的训练权重和评估结果,其中YOLOv9-e模型在PPE检测中达到了超过70.9%的准确率。
使用许可
SH17数据集遵循CC BY-NC-SA 4.0许可协议,仅供教育、研究和分析目的使用。用户在使用数据时应遵守Pexels网站的版权声明,并确保使用数据的行为符合法律和道德规范。

FMA (Free Music Archive)
免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集
OpenDataLab 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Sleep
该数据集包含关于睡眠效率和持续时间的信息,每个条目代表一个独特的睡眠体验,并包括ID、年龄、性别、睡眠持续时间、睡眠效率、REM睡眠百分比、深度睡眠百分比、轻度睡眠百分比、觉醒次数、咖啡因消费、酒精消费和吸烟状况等列。
github 收录
PQAref
PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。
huggingface 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录