GC10-DET|工业检测数据集|表面缺陷识别数据集
收藏数据集概述
数据集名称
GC10-DET
数据集描述
GC10-DET是一个在真实工业环境中收集的表面缺陷数据集,包含十种类型的表面缺陷,如冲孔、焊缝、新月形缝隙等。该数据集包含3570张灰度图像,所有缺陷均位于钢板表面。
数据集获取
数据集可在GitHub上获得,链接为:https://github.com/lvxiaoming2019/GC10-DET-Metallic-Surface-Defect-Matasets。若原始数据集存在错误,可使用修正后的版本,链接为:http://t.csdnimg.cn/jNolA。
数据集划分
数据集总共包含2294个样本,按照约9:1的比例划分为训练集和验证集。其中,训练集包含1998个样本,验证集包含296个样本。
数据集格式
为适应YOLOv6模型的需求,数据集需进行格式转换:
- images:图片被划分在训练集和验证集两个文件夹中。
- annotations:分别生成train和val的json文件。
- labels:数据集的标签为xml格式,需转换成txt格式,并对数据进行归一化处理。
YOLO格式数据集下载
YOLO格式的GC10-DET数据集下载链接为:https://pan.baidu.com/s/11slnV0Bvpagweqxzi2UgDw?pwd=zzai,提取码为zzai。

UCI Machine Learning Repository
UCI机器学习库是一个包含数据库、领域理论和数据生成器的集合,这些被机器学习社区用于机器学习算法的实证分析。
github 收录
MECCANO
MECCANO数据集是首个专注于工业类似环境中第一人称视角下人类-物体交互的研究数据集。该数据集由20名参与者在模拟工业场景中构建摩托车玩具模型的视频组成,包含299,376帧视频数据。数据集不仅标注了时间上的动作片段,还标注了空间上的活跃物体边界框,涵盖了12种动词、20种名词和61种独特动作的分类。MECCANO数据集旨在推动工业环境中第一人称视角下人类动作识别、活跃物体检测、活跃物体识别及第一人称视角下人类-物体交互检测等任务的研究。
arXiv 收录
UCI Wine
UCI Wine数据集包含了178个样本,每个样本有13个特征,用于分类任务。这些特征包括葡萄酒的化学成分,如酒精含量、苹果酸、灰分等。数据集的目标是将葡萄酒分类为三个不同的品种。
archive.ics.uci.edu 收录
Pet Disease images
Comprehensive Image Dataset for Detecting Pet Diseases Across Multiple Species
kaggle 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录