ibm-research/cif-dataset

Name: ibm-research/cif-dataset
Creator: ibm-research
Published: 2026-05-07 08:32:02
License: 暂无描述

Hugging Face2026-05-07 更新2026-05-10 收录

下载链接：

https://hf-mirror.com/datasets/ibm-research/cif-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于实例分割的民用基础设施视觉检测数据集，包含6种缺陷/条件类别：藻类、裂缝、网状裂缝、带降水的裂缝、锈蚀和剥落。数据集提供全分辨率检查图像和1024×1024的切片图像，每种样本都有相同的字段，包括图像ID、图像、文件名、宽度、高度等。切片样本还包含额外的字段，如切片行、切片列、原始文件名等。数据集分为训练、验证和测试集，每个集都有全分辨率和切片版本。

A civil-infrastructure visual inspection dataset for instance segmentation with 6 defect/condition categories: Algae, Crack, Net-Crack, Crack with Precipitation, Rust, and Spalling. The dataset provides full-resolution inspection images and 1024×1024 tiles, with each sample having the same fields including image ID, image, file name, width, height, etc. Tiled samples also include additional fields such as tile row, tile column, original file name, etc. The dataset is divided into training, validation, and test sets, each with full-resolution and tiled versions.

提供机构：

ibm-research

搜集汇总

数据集介绍

构建方式

该数据集专为民用基础设施的视觉检测而设计，聚焦于六类典型结构缺陷（藻类、裂缝、网状裂缝、裂缝伴析出物、锈蚀及剥落）的实例分割任务。数据构建过程中，采集了高分辨率实地巡检图像，并同步衍生出1024×1024像素的瓦片化样本，每个瓦片均保留原始图像的元数据（如瓦片行列坐标、父图像文件名及尺寸），而全分辨率样本中这些字段则设置为空值。数据划分为训练（9096全分辨与105139瓦片）、验证（1942全分辨与22368瓦片）和测试（1858全分辨与21135瓦片）六个独立分片，以Parquet格式存储，便于高效加载与选择性下载。

特点

数据集的核心特色在于其双重分辨率结构与灵活的访问机制。全分辨率样本保留了原始巡检图像的全局语境，适合大范围缺陷的宏观分析；瓦片化样本则通过固定尺寸切割，降低了单次推理的计算负担，适配于局部细节的精细检测。每个样本均遵循COCO标注格式，包含多边形分割掩码与边界框，支持实例分割与目标检测任务的联合训练。此外，数据集在HuggingFace上提供了六种独立配置，用户可通过指定配置名称实现仅下载特定分片，显著减少网络传输与存储开销，同时便于跨场景复现实验。

使用方法

加载数据集时，推荐使用HuggingFace datasets库的load_dataset函数。若不指定配置，默认返回包含所有六个分片的DatasetDict对象；若需选择性使用，可通过第二个参数传入配置名（如'train_tiled'），并配合split参数指定子集。运行时可通过检查sample['tile_row']是否为None，来区分样本类型是全分辨率图像还是瓦片。可视化方面，可借助FiftyOne工具快速预览：先将图像保存至临时文件，然后构建Detection与Polyline对象，分别为边界框和分割多边形添加标注，最终在本地浏览器中交互式浏览检测与分割结果。

背景与挑战

背景概述

该数据集名为“Cracks in the Foundation”（CIF），由IBM研究团队于2025年创建，专注于土木基础设施视觉检测中的实例分割任务。核心研究问题在于利用计算机视觉技术自动识别与量化混凝土表面六类典型病害——藻类、裂缝、网状裂缝、析出裂缝、锈蚀及剥落。数据源自桥梁、公路、机场等实际巡查场景，涵盖全分辨率图像与1024×1024瓦片两种格式，兼具多样性与实用性。其发布为土木工程与人工智能交叉领域提供了标准化基准，有力推动了基础设施维护的自动化进程。

当前挑战

该数据集所解决的领域问题挑战在于：缺陷形态多变、尺度差异大，且常与环境噪声共存，传统人工检测效率低且主观性强，亟需鲁棒的自动分割模型。构建过程中面临多重困难：原始采集图像尺寸悬殊，需通过瓦片化策略平衡细节保留与计算资源；缺陷标注需跨多类目（如区分普通裂缝与析出裂缝），标注人员需具备专业判别经验；不同光照、拍摄角度及表面纹理的引入进一步提升了数据异质性，对模型泛化能力构成严峻考验。

常用场景

经典使用场景

CIF数据集（Cracks in the Foundation）专为土木基础设施视觉检测任务而设计，其经典应用场景聚焦于基于航拍或近景影像的混凝土表面缺陷实例分割与目标检测。该数据集覆盖了六类典型病害——藻类、裂缝、网状裂缝、含析出物裂缝、锈蚀及剥落，并提供了全分辨率原始图像与1024×1024分块图像两种配置，以适应不同尺度的模型训练需求。研究者常利用其COCO格式的边界框与多边形分割标注，训练诸如Mask R-CNN、YOLOv8-seg等深度神经网络，实现对基础设施表面缺陷的高精度定位与像素级轮廓勾勒。

衍生相关工作

CIF数据集的发布催生了多项值得关注的衍生研究。在数据增强方向，有工作基于其全分辨率与分块图像的对应关系，探索了跨尺度特征迁移学习策略，以提升小目标裂缝的检测召回率。在模型轻量化领域，部分研究利用该数据集的标注质量，通过知识蒸馏或神经架构搜索方法，设计了适合边缘设备部署的紧凑型分割网络。此外，该数据集的类别定义也启发了多标签弱监督学习方法的评估，尤其是在“裂缝+析出物”这类复合缺陷场景下，模型如何在不依赖像素级标注的前提下学习联合语义表征。同时，该数据集的许可协议（CDLA-Permissive 2.0）为工业界与学术界的后续数据集构建与基准竞赛提供了可复用的数据共享框架。

数据集最近研究