five

Pavementscapes|路面损伤检测数据集|深度学习数据集

收藏
arXiv2022-07-24 更新2024-06-21 收录
路面损伤检测
深度学习
下载链接:
https://github.com/tongzheng1992/Pavementscapes
下载链接
链接失效反馈
资源简介:
Pavementscapes是一个大规模的分层图像数据集,由东南大学交通学院创建,用于沥青路面损伤分割。该数据集包含4000张分辨率为1024×2048的图像,这些图像来自中国15个不同路面的实际检测项目。数据集中的8680个损伤实例在像素级别上手动标记,涵盖6种损伤类别。Pavementscapes数据集旨在通过深度神经网络开发和评估路面损伤分割方法,解决现有公共数据集在路面损伤分割领域的局限性。
提供机构:
东南大学交通学院
创建时间:
2022-07-24
AI搜集汇总
数据集介绍
main_image_url
构建方式
Pavementscapes数据集的构建基于真实世界的路面检测项目,涵盖了15种不同类型的路面。数据采集通过多功能检测车辆搭载的专业相机进行,相机以俯视角度拍摄路面图像,分辨率为1024×2048。从超过50万张图像中筛选出4000张包含至少一种路面损坏的图像,并由五名具有至少五年路面检测经验的标注员进行手动标注。标注分为图像级、块级和像素级三个层次,涵盖了六种损坏类别,确保了数据集的多样性和准确性。
特点
Pavementscapes数据集包含4000张高分辨率图像,共计8680个损坏实例,涵盖了六种常见的路面损坏类型。数据集的独特之处在于其多层次的标注方式,尤其是像素级标注,能够为深度学习模型提供精确的训练和测试数据。此外,数据集还包含了非典型视角的路面损坏图像,增加了数据集的复杂性和真实性。这些特点使得Pavementscapes成为路面损坏分割领域的重要基准数据集。
使用方法
Pavementscapes数据集的使用方法主要围绕深度学习模型的训练和测试展开。数据集已预先划分为训练集、验证集和测试集,用户可以直接使用这些划分进行模型训练和评估。数据集支持多种标注层次,用户可以根据需求选择图像级、块级或像素级标注进行模型训练。此外,数据集还提供了详细的统计分析和实验结果,用户可以参考这些结果进行模型优化和性能对比。数据集的使用不仅限于路面损坏分割,还可用于其他计算机视觉任务,如目标检测和分类。
背景与挑战
背景概述
Pavementscapes数据集由东南大学交通学院的郑桐、马涛等研究人员于2022年提出,旨在解决沥青路面损伤分割领域的数据匮乏问题。该数据集包含4000张分辨率为1024×2048的真实路面图像,涵盖了15种不同路面的损伤情况,共计8680个损伤实例,并在像素级别标注了六种损伤类别。Pavementscapes的创建为深度学习在路面损伤分割中的应用提供了重要的数据支持,推动了该领域的研究进展。该数据集不仅为路面损伤分割算法的开发与评估提供了基准,还通过实验揭示了现有深度学习模型在损伤分割中的问题与潜在解决方案。
当前挑战
Pavementscapes数据集在解决路面损伤分割问题时面临多重挑战。首先,路面损伤的多样性与复杂性使得模型难以准确分割不同类型的损伤,尤其是细小的裂缝。其次,数据集的构建过程中,标注工作耗时且需要高精度,尤其是在像素级别的标注中,确保每个像素的类别准确性是一项艰巨的任务。此外,数据集中不同类别的样本分布不均衡,导致模型在训练过程中容易偏向于样本较多的类别,影响了对少数类别的识别效果。最后,尽管深度学习模型在损伤分割中表现出色,但其在非典型视角下的分割性能仍有待提升,这反映了真实路面检测项目中的复杂性。
常用场景
经典使用场景
Pavementscapes数据集主要用于沥青路面损伤的语义分割任务。该数据集包含4000张高分辨率图像,涵盖了15种不同类型的路面,并标注了8680个损伤实例,涵盖了六种常见的路面损伤类型。这些图像以自上而下的视角拍摄,能够准确捕捉路面损伤的形态信息。Pavementscapes数据集为深度学习模型提供了丰富的训练和测试数据,特别适用于卷积神经网络(CNN)和基于注意力机制的神经网络在路面损伤分割中的应用。
实际应用
Pavementscapes数据集在实际应用中具有广泛的潜力,特别是在智能交通系统和道路维护领域。通过使用该数据集训练的深度学习模型,可以实现自动化的路面损伤检测与分类,减少人工巡检的成本和时间。此外,该数据集还可用于开发实时路面监测系统,帮助交通管理部门及时发现并修复路面损伤,提升道路安全性和使用寿命。
衍生相关工作
Pavementscapes数据集的发布催生了一系列基于深度学习的路面损伤分割研究。许多经典工作如U-Net、DeepLabv3+等卷积神经网络模型在该数据集上进行了性能评估和优化。此外,基于注意力机制的神经网络(如Transformer)也在该数据集上展现了优异的性能,推动了路面损伤分割技术的进一步发展。这些研究不仅提升了路面损伤分割的精度,还为未来的智能交通系统提供了技术基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。

arXiv 收录

Wafer Defect

该数据集包含了七个主要类别的晶圆缺陷,分别是:BLOCK ETCH、COATING BAD、PARTICLE、PIQ PARTICLE、PO CONTAMINATION、SCRATCH和SEZ BURNT。这些类别涵盖了晶圆在生产过程中可能出现的多种缺陷类型,每一种缺陷都有其独特的成因和表现形式。数据集不仅在类别数量上具有多样性,而且在样本的多样性和复杂性上也展现了其广泛的应用潜力。每个类别的样本均经过精心标注,确保了数据的准确性和可靠性。

github 收录