GC10-DET|工业检测数据集|表面缺陷识别数据集
收藏数据集概述
数据集名称
GC10-DET
数据集描述
GC10-DET是一个在真实工业环境中收集的表面缺陷数据集,包含十种类型的表面缺陷,如冲孔、焊缝、新月形缝隙等。该数据集包含3570张灰度图像,所有缺陷均位于钢板表面。
数据集获取
数据集可在GitHub上获得,链接为:https://github.com/lvxiaoming2019/GC10-DET-Metallic-Surface-Defect-Matasets。若原始数据集存在错误,可使用修正后的版本,链接为:http://t.csdnimg.cn/jNolA。
数据集划分
数据集总共包含2294个样本,按照约9:1的比例划分为训练集和验证集。其中,训练集包含1998个样本,验证集包含296个样本。
数据集格式
为适应YOLOv6模型的需求,数据集需进行格式转换:
- images:图片被划分在训练集和验证集两个文件夹中。
- annotations:分别生成train和val的json文件。
- labels:数据集的标签为xml格式,需转换成txt格式,并对数据进行归一化处理。
YOLO格式数据集下载
YOLO格式的GC10-DET数据集下载链接为:https://pan.baidu.com/s/11slnV0Bvpagweqxzi2UgDw?pwd=zzai,提取码为zzai。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
GVJahnavi/Crops_set
该数据集包含图像和标签两个主要特征。图像特征的数据类型为图像,标签特征的数据类型为类标签,具体包括20种不同的植物病害和健康状态,如玉米的灰斑病、普通锈病、北方叶枯病,以及番茄的细菌性斑点病、早疫病、晚疫病等。数据集分为训练集和测试集,训练集包含25384个样本,测试集包含6346个样本。数据集的下载大小为514893426字节,总大小为474216412.07000005字节。
hugging_face 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录