ShixuanAn/RDD_2020
收藏数据集卡片 RDD_2020
数据集概述
RDD2020 数据集是一个包含来自印度、日本和捷克共和国的 26,336 张道路图像的综合集合,标注了超过 31,000 个道路损坏实例。该数据集旨在支持自动道路损坏检测的机器学习模型的开发和评估,为市政和道路机构提供了一个有价值的资源,用于高效的道路状况监测。
数据集详情
数据集描述
- 来源: Mendeley Data - DOI: 10.17632/5ty2wb6gvg.1
- 大小: 1.13 GB
- 格式: 图像(JPEG)和标注(PASCAL VOC 格式的 XML)
- 分辨率:
- 印度:720 × 720 像素
- 日本和捷克:600 × 600 像素
- 类别: 纵向裂缝(D00)、横向裂缝(D10)、鳄鱼裂缝(D20)、坑洼(D40)
- 许可证: https://creativecommons.org/licenses/by/4.0/
数据集结构
数据实例
数据将遵循以下结构: json { "image_id": "Czech_000248", "country": "Czech", "type": "train", "image": "<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=600x600>", "image_path": "train/Czech/images/Czech_000248.jpg", "crack_type": ["D20", "D20"], "crack_coordinates": { "x_min": [188, 3], "x_max": [309, 171], "y_min": [463, 438], "y_max": [509, 519] } }
数据字段
- "image_id"[string]: 图像的ID,由国家加上顺序号组成。
- "country"[string]: 照片拍摄的国家。
- "type"[string]: 图像所属的数据集类别,如 train, test1, 或 test2。
- "image"[integer]: 转换为 PIL 格式的图像数据。
- "crack_type"[string]: 图像中检测到的裂缝类型。
- "crack_coordinates"[integer]: 包含裂缝坐标的整数。
数据集创建
数据收集和处理
道路图像(.jpg)使用车载智能手机以约 40Km/h 的平均速度收集。使用 LabelImg 工具创建 XML 文件来标注图像中的道路损坏。
数据源生产者
Deeksha Arya, Hiroya Maeda, Sanjay Kumar Ghosh, Durga Toshniwal, Hiroshi Omata, Takehiro Kashiyama, Toshikazu Seto, Alexander Mraz, Yoshihide Sekimot
标注
标注过程
每个图像都带有相应的 XML 文件,包含 PASCAL VOC 格式的标注。这些标注描述了图像中道路损坏的位置和类型,分为四个主要类型:纵向裂缝(D00)、横向裂缝(D10)、鳄鱼裂缝(D20)和坑洼(D40)。
社会影响
RDD2020 数据集的结构化旨在对道路基础设施管理产生有针对性的可衡量影响。通过将原始图像和 XML 标注转换为具有清晰定义属性的数据集,如 photo_id、country、type、pics_array、image_resolution、crack_type 和 crack_coordinates,为市政和道路机构创建了一个强大的工具。这些实体可以部署机器学习模型,准确识别和分类道路损坏,如裂缝和坑洼,这对道路维护和安全至关重要。
偏差、风险和局限性
该数据集主要包含来自三个国家(印度、日本和捷克共和国)的图像,可能无法全面代表全球的道路状况。用户在将基于此数据集训练的模型推广到其他地区时应谨慎。
建议
用户应了解数据集的风险、偏差和技术局限性。需要更多信息以提供进一步的建议。




