SafetyHelmetWearing-Dataset|安全帽检测数据集|图像识别数据集
收藏SafetyHelmetWearing-Dataset 概述
数据集简介
SafetyHelmetWearing-Dataset(SHWD)是一个用于安全帽佩戴和人类头部检测的数据集。该数据集包含7581张图像,其中9044个安全帽佩戴对象(正例)和111514个正常头部对象(未佩戴或负例)。正例对象来源于Google或Baidu,并通过LabelImg手动标注。部分负例对象来自SCUT-HEAD数据集,经过修复原数据集的错误后,以Pascal VOC格式直接加载。此外,数据集还提供了基于MXNet GluonCV的预训练模型。
数据集与模型下载
- 数据集下载:
- 模型下载:
数据集格式
数据集标注为Pascal VOC格式,包含以下目录结构:
---VOC2028
---Annotations
---ImageSets
---JPEGImages
数据集定义了两个对象类别:“hat”(正例对象)和“person”(负例对象)。
使用方法
依赖项
确保安装了MXNet、GluonCV和OpenCV。
测试预训练模型
- 第一种方式:
下载模型后,运行
python test_yolo.py
,可调整的选项包括网络类型、阈值、是否使用GPU及图像短边输入大小。 - 第二种方式:
下载符号模型后,运行
python test_symbol.py
进行推理。
训练模型
在train_yolo.py
中设置数据集路径,例如:
train_dataset = VOCLike(root=D:VOCdevkit, splits=[(2028, trainval)]) val_dataset = VOCLike(root=D:VOCdevkit, splits=[(2028, test)])
然后根据需要设置训练选项,如批量大小、工作进程数和预热周期等。
注意事项
- 训练YOLO模型时,注意避免梯度爆炸问题,可通过增加预热周期或减小学习率来解决。
- 数据集加载可能占用大量CPU资源,增加工作进程数可提高训练速度。
- 在Windows系统上训练时,程序可能会阻塞,需检查系统资源分配。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
WLASL, MSASL, NMFs-CSL, SLR500, Slovo, BOBSL, 27 Class Sign Language Dataset, AUTSL, BosphorusSign22k, GSL, LSA16, LSA64, Rendered Handpose Dataset, YouTube-ASL, LSFB-ISOL, ASLLVD, AASL, KArSL, BdSLImset, HaGRID, Phoenix-2014, Phoenix-2014T
该仓库收集了多种与手语识别和翻译相关的数据集,旨在为研究者、开发者和爱好者提供一个集中的资源。数据集包括不同类型(如RGB、深度、骨骼)和来自不同国家的数据,用于支持手语识别和翻译技术的研究。
github 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录