Francesco/corrosion-bi3q3
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Francesco/corrosion-bi3q3
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image_id
dtype: int64
- name: image
dtype: image
- name: width
dtype: int32
- name: height
dtype: int32
- name: objects
sequence:
- name: id
dtype: int64
- name: area
dtype: int64
- name: bbox
sequence: float32
length: 4
- name: category
dtype:
class_label:
names:
'0': corrosion-0
'1': Slippage
'2': corrosion
'3': crack
annotations_creators:
- crowdsourced
language_creators:
- found
language:
- en
license:
- cc
multilinguality:
- monolingual
size_categories:
- 1K<n<10K
source_datasets:
- original
task_categories:
- object-detection
task_ids: []
pretty_name: corrosion-bi3q3
tags:
- rf100
---
# Dataset Card for corrosion-bi3q3
** The original COCO dataset is stored at `dataset.tar.gz`**
## Dataset Description
- **Homepage:** https://universe.roboflow.com/object-detection/corrosion-bi3q3
- **Point of Contact:** francesco.zuppichini@gmail.com
### Dataset Summary
corrosion-bi3q3
### Supported Tasks and Leaderboards
- `object-detection`: The dataset can be used to train a model for Object Detection.
### Languages
English
## Dataset Structure
### Data Instances
A data point comprises an image and its object annotations.
```
{
'image_id': 15,
'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>,
'width': 964043,
'height': 640,
'objects': {
'id': [114, 115, 116, 117],
'area': [3796, 1596, 152768, 81002],
'bbox': [
[302.0, 109.0, 73.0, 52.0],
[810.0, 100.0, 57.0, 28.0],
[160.0, 31.0, 248.0, 616.0],
[741.0, 68.0, 202.0, 401.0]
],
'category': [4, 4, 0, 0]
}
}
```
### Data Fields
- `image`: the image id
- `image`: `PIL.Image.Image` object containing the image. Note that when accessing the image column: `dataset[0]["image"]` the image file is automatically decoded. Decoding of a large number of image files might take a significant amount of time. Thus it is important to first query the sample index before the `"image"` column, *i.e.* `dataset[0]["image"]` should **always** be preferred over `dataset["image"][0]`
- `width`: the image width
- `height`: the image height
- `objects`: a dictionary containing bounding box metadata for the objects present on the image
- `id`: the annotation id
- `area`: the area of the bounding box
- `bbox`: the object's bounding box (in the [coco](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco) format)
- `category`: the object's category.
#### Who are the annotators?
Annotators are Roboflow users
## Additional Information
### Licensing Information
See original homepage https://universe.roboflow.com/object-detection/corrosion-bi3q3
### Citation Information
```
@misc{ corrosion-bi3q3,
title = { corrosion bi3q3 Dataset },
type = { Open Source Dataset },
author = { Roboflow 100 },
howpublished = { \url{ https://universe.roboflow.com/object-detection/corrosion-bi3q3 } },
url = { https://universe.roboflow.com/object-detection/corrosion-bi3q3 },
journal = { Roboflow Universe },
publisher = { Roboflow },
year = { 2022 },
month = { nov },
note = { visited on 2023-03-29 },
}"
```
### Contributions
Thanks to [@mariosasko](https://github.com/mariosasko) for adding this dataset.
dataset_info:
特征列表:
- 字段名:image_id,数据类型:int64
- 字段名:image,数据类型:image
- 字段名:width,数据类型:int32
- 字段名:height,数据类型:int32
- 字段名:objects,序列类型,其子项包括:
- 子字段名:id,数据类型:int64
- 子字段名:area,数据类型:int64
- 子字段名:bbox,序列类型,元素类型为float32,固定长度为4
- 子字段名:category,数据类型为类别标签(class_label),其类别名称映射如下:
'0': corrosion-0(腐蚀-0)
'1': Slippage(滑移)
'2': corrosion(腐蚀)
'3': crack(裂纹)
标注生成方式:众包
语言数据采集方式:公开获取
语言:英语
许可证:知识共享(CC)协议
多语言属性:单语言
样本规模区间:1000 < 样本量 < 10000
源数据集类型:原始数据集
任务类别:目标检测(object-detection)
任务子项:无
数据集昵称:corrosion-bi3q3
标签:rf100
# 数据集卡片:corrosion-bi3q3
**原始COCO格式数据集存储于`dataset.tar.gz`文件中**
## 数据集说明
- **主页**:https://universe.roboflow.com/object-detection/corrosion-bi3q3
- **联系方式**:francesco.zuppichini@gmail.com
### 数据集概述
corrosion-bi3q3
### 支持任务与排行榜
- `目标检测(object-detection)`:本数据集可用于训练目标检测模型。
### 语言
英语
## 数据集结构
### 数据实例
单个数据点包含一张图像及其对应的目标标注信息。
{
'image_id': 15,
'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>,
'width': 964043,
'height': 640,
'objects': {
'id': [114, 115, 116, 117],
'area': [3796, 1596, 152768, 81002],
'bbox': [
[302.0, 109.0, 73.0, 52.0],
[810.0, 100.0, 57.0, 28.0],
[160.0, 31.0, 248.0, 616.0],
[741.0, 68.0, 202.0, 401.0]
],
'category': [4, 4, 0, 0]
}
}
### 数据字段
- `image_id`:图像唯一标识符
- `image`:存储图像的`PIL.Image.Image`对象。请注意,当访问图像列时,执行`dataset[0]["image"]`会自动对图像文件进行解码。解码大量图像文件可能会耗费较多时间,因此建议优先通过样本索引查询后再访问`"image"`列,即**始终优先使用`dataset[0]["image"]`而非`dataset["image"][0]`**
- `width`:图像宽度
- `height`:图像高度
- `objects`:包含图像中所有目标对象的边界框元数据的字典,其内部子字段包括:
- `id`:标注的唯一ID
- `area`:对应边界框的像素面积
- `bbox`:目标对象的边界框坐标,采用[COCO格式](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco)
- `category`:目标对象的类别标签。
#### 标注人员说明
标注人员均为Roboflow平台用户。
## 附加信息
### 许可信息
详见数据集主页:https://universe.roboflow.com/object-detection/corrosion-bi3q3
### 引用信息
@misc{ corrosion-bi3q3,
title = { corrosion bi3q3 Dataset },
type = { Open Source Dataset },
author = { Roboflow 100 },
howpublished = { url{ https://universe.roboflow.com/object-detection/corrosion-bi3q3 } },
url = { https://universe.roboflow.com/object-detection/corrosion-bi3q3 },
journal = { Roboflow Universe },
publisher = { Roboflow },
year = { 2022 },
month = { nov },
note = { visited on 2023-03-29 },
}
### 贡献致谢
感谢[@mariosasko](https://github.com/mariosasko)将本数据集添加至仓库。
提供机构:
Francesco
原始信息汇总
数据集概述
- 名称: corrosion-bi3q3
- 任务类型: 对象检测
- 语言: 英语
- 多语言性: 单语
- 数据集大小: 1K<n<10K
- 源数据集: 原创
数据集结构
数据实例
每个数据点包含一张图片及其对象标注。
json { image_id: 15, image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>, width: 964043, height: 640, objects: { id: [114, 115, 116, 117], area: [3796, 1596, 152768, 81002], bbox: [ [302.0, 109.0, 73.0, 52.0], [810.0, 100.0, 57.0, 28.0], [160.0, 31.0, 248.0, 616.0], [741.0, 68.0, 202.0, 401.0] ], category: [4, 4, 0, 0] } }
数据字段
image_id: 图片ID,数据类型为int64。image: 图片对象,数据类型为image。width: 图片宽度,数据类型为int32。height: 图片高度,数据类型为int32。objects: 对象信息,包含以下子字段:id: 标注ID,数据类型为int64。area: 边界框面积,数据类型为int64。bbox: 对象边界框,数据类型为float32,长度为4。category: 对象类别,类别标签包括corrosion-0,Slippage,corrosion,crack。
标注信息
- 标注创建者: 众包
- 标注者: Roboflow用户
搜集汇总
数据集介绍

构建方式
在工业检测领域,腐蚀与结构损伤的识别对基础设施维护至关重要。corrosion-bi3q3数据集通过众包方式构建,由Roboflow平台用户对图像进行标注,形成面向目标检测任务的标注数据。原始图像来源于实际工业场景,标注过程遵循COCO格式标准,确保了边界框与类别信息的一致性与规范性。数据集规模介于一千至一万样本之间,涵盖了腐蚀、滑移、裂纹等多种缺陷类型,为模型训练提供了丰富的视觉样本。
特点
该数据集专为工业缺陷检测设计,其核心特点在于多类别目标标注,涵盖腐蚀、滑移及裂纹等典型结构损伤。每张图像均附带详细的边界框与面积信息,标注格式与COCO标准兼容,便于直接应用于主流检测框架。图像分辨率统一为640x640像素,确保了输入尺寸的一致性,同时保留了原始宽高比信息。数据以英文标注,属于单语数据集,规模适中,适合用于模型训练与验证。
使用方法
使用corrosion-bi3q3数据集时,可直接加载HuggingFace平台提供的压缩文件,通过标准数据接口访问图像与标注信息。建议优先按样本索引提取数据,以避免大规模图像解码时的性能开销。该数据集适用于目标检测模型的训练与评估,可借助Albumentations等工具进行数据增强。用户需遵循CC许可协议,并参考Roboflow Universe提供的原始主页获取详细使用条款与更新信息。
背景与挑战
背景概述
在工业设施健康监测领域,腐蚀、裂纹和滑移等结构缺陷的自动识别是保障安全与延长资产寿命的关键。腐蚀-bi3q3数据集由Roboflow社区于2022年构建,作为Roboflow 100(RF100)基准的一部分,专注于目标检测任务。该数据集通过众包方式标注,包含腐蚀、滑移和裂纹等多类缺陷的边界框注释,旨在为机器学习模型提供训练资源,以推动工业视觉检测技术的发展,提升自动化缺陷识别的准确性与效率。
当前挑战
该数据集致力于解决工业场景中结构缺陷的目标检测挑战,其核心难点在于缺陷形态的多样性与环境复杂性,如腐蚀区域的纹理变化、裂纹的细微特征以及光照不均带来的干扰。在构建过程中,挑战主要源于众包标注的一致性与质量控制,不同标注者对缺陷边界的理解可能存在偏差,且数据规模有限(1K至10K样本),可能影响模型的泛化能力。此外,数据集中类别不平衡与标注格式的统一性也是需要克服的障碍。
常用场景
经典使用场景
在工业设施健康监测领域,腐蚀、裂纹等结构缺陷的自动识别是保障安全运行的关键环节。Francesco/corrosion-bi3q3数据集以其标注精细的图像样本,为基于深度学习的物体检测模型提供了理想的训练与验证平台。该数据集常被用于构建和优化卷积神经网络,使其能够精准定位并分类图像中的腐蚀、滑移及裂纹等缺陷区域,从而实现对工业设备表面状态的智能化评估。
实际应用
在实际工程场景中,该数据集支撑的检测模型已广泛应用于石油化工、桥梁隧道、电力设施等基础设施的定期巡检与预防性维护。通过部署搭载此类模型的无人机或固定摄像头系统,能够实现大面积、高频次的自动化缺陷筛查,显著提升检测效率与准确性,降低人工巡检的成本与安全风险,为预测性维护决策提供可靠的数据支持。
衍生相关工作
围绕该数据集,学术界与工业界衍生出一系列经典研究工作。例如,基于Faster R-CNN、YOLO系列等架构的改进模型被提出,以提升对腐蚀、裂纹等小尺寸缺陷的检测精度。同时,一些研究聚焦于利用该数据集进行知识蒸馏或跨域迁移学习,以解决标注数据不足的问题。这些工作不仅丰富了缺陷检测的技术体系,也促进了相关算法在更广泛工业场景中的落地应用。
以上内容由遇见数据集搜集并总结生成



