SafetyHelmetWearing-Dataset|安全帽检测数据集|图像识别数据集
收藏安全帽佩戴检测数据集概述
数据集描述
- 名称: SafetyHelmetWearing-Dataset (SHWD)
- 用途: 用于安全帽佩戴和人类头部检测
- 图像数量: 7581张
- 标注对象:
- 安全帽佩戴对象(正例): 9044个
- 正常头部对象(未佩戴或负例): 111514个
- 数据来源:
- 正例对象来自Google或Baidu
- 部分负例对象来自SCUT-HEAD数据集,经过修正以适应Pascal VOC格式
- 标注工具: 使用LabelImg手动标注
数据集与模型下载
- 数据集下载链接:
- 模型下载链接:
数据集格式
- 标注格式: Pascal VOC格式
- 对象类别:
- "hat"(正例)
- "person"(负例)
使用方法
- 依赖: 需要安装MXNet, GluonCV, OpenCV
- 测试:
- 使用预训练模型进行推理,可通过命令行参数调整网络类型、置信度阈值、是否使用GPU及图像短边输入大小
- 训练:
- 设置数据集路径,使用
train_yolo.py
进行训练,可通过命令行参数调整批量大小、工作进程数和预热周期
- 设置数据集路径,使用
注意事项
- 训练问题:
- 防止梯度爆炸,可尝试增加预热周期或降低学习率
- 多核CPU可提高数据加载速度
- 在Windows系统上训练时可能遇到程序阻塞问题,Linux系统需确保有足够的共享内存

CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录