five

dacl10k|桥梁损伤评估数据集|语义分割数据集

收藏
arXiv2023-09-01 更新2024-08-06 收录
桥梁损伤评估
语义分割
下载链接:
http://arxiv.org/abs/2309.00460v1
下载链接
链接失效反馈
资源简介:
dacl10k是由德国联邦国防军大学创建的多标签语义分割数据集,包含9920张来自实际桥梁检查的图像,用于识别和评估混凝土桥梁的损伤。数据集区分了12种损伤类别和6种桥梁组件,这些组件在建筑评估和推荐行动中起关键作用。dacl10k旨在通过自动化损伤识别,提高桥梁检查的效率和准确性,解决因人员短缺和预算限制导致的检查和修复间隔不足的问题。
提供机构:
德国联邦国防军大学
创建时间:
2023-09-01
AI搜集汇总
数据集介绍
main_image_url
构建方式
dacl10k数据集通过从德国的工程办公室和地方当局收集的9,920张真实桥梁检查图像构建而成。这些图像涵盖了2000年至2020年间拍摄的多种摄像机类型、姿态、光照条件和分辨率。数据集的构建遵循了桥梁检查标准,确保了数据集的多样性和实用性。数据集包含了12种常见的混凝土缺陷和6种桥梁结构部件,这些类别在桥梁评估和修复建议中起着关键作用。
特点
dacl10k数据集的显著特点在于其规模和多样性,涵盖了9,920张图像,远超现有同类数据集。数据集不仅包含了多种混凝土缺陷,还涵盖了桥梁结构部件,支持多标签语义分割任务。此外,数据集提供了详细的背景知识和标注指南,确保了标注的一致性和准确性。
使用方法
dacl10k数据集适用于多标签语义分割任务,研究人员和实践者可以利用该数据集训练和评估模型,以实现桥梁缺陷的自动识别、测量和定位。数据集提供了多种基线模型和评估指标,用户可以根据需要选择合适的模型架构和编码器进行实验。通过公开发布的数据集和基线模型,研究人员可以进一步推动桥梁结构损伤识别领域的研究。
背景与挑战
背景概述
桥梁作为全球基础设施的重要组成部分,长期暴露于交通负荷、极端天气事件等影响下,导致其结构损伤频发。特别是在20世纪50年代至80年代经济快速发展的国家,桥梁的损伤问题尤为突出。传统的桥梁检测通常依赖于专业工程师的视觉检查,通过拍摄照片并记录损伤类型、尺寸和位置,但这种方式效率低下且容易出错。为了应对这一挑战,慕尼黑联邦国防大学的Johannes Flotzinger、Philipp J. Rösch和Thomas Braml等人于2023年推出了dacl10k数据集,该数据集包含了9,920张来自实际桥梁检测的多标签语义分割图像,涵盖12种损伤类型和6种桥梁构件。dacl10k数据集的推出填补了桥梁损伤识别领域的空白,成为该领域目前规模最大、类别最丰富的语义分割基准数据集,为自动化桥梁检测提供了重要的研究基础。
当前挑战
dacl10k数据集在构建过程中面临多重挑战。首先,桥梁损伤的多样性和复杂性使得数据标注变得异常困难,尤其是需要区分视觉上相似的损伤类型,如裂缝与鳄鱼裂缝、风化与湿斑等。其次,数据集的类别分布不均衡,某些损伤类型(如风化和防护设备)的像素数量远超其他类别,导致模型在训练过程中容易偏向这些高频类别。此外,数据集的图像来源多样,拍摄条件(如光照、角度、分辨率)差异较大,增加了模型在实际应用中的泛化难度。最后,桥梁损伤的语义分割任务要求高精度的像素级分类,尤其是在裂缝等细小损伤的识别上,现有的标注精度尚不足以满足实际检测需求。
常用场景
经典使用场景
dacl10k数据集在桥梁损伤语义分割领域具有经典应用场景,主要用于训练和评估多标签语义分割模型。该数据集包含了9,920张来自实际桥梁检测的图像,涵盖了12种损伤类别和6种桥梁构件。通过这些图像,研究人员可以开发和验证能够自动识别、分类和定位桥梁损伤的模型,从而为桥梁检测提供高效且准确的解决方案。
实际应用
dacl10k数据集在实际应用中具有广泛的前景,特别是在桥梁维护和修复领域。通过自动化损伤识别,桥梁检测人员可以更快速、准确地评估桥梁的结构完整性,识别需要修复的区域,并制定相应的维护计划。此外,该数据集还可用于无人机或智能手机等设备上的实时桥梁检测系统,帮助提高检测效率,减少人工成本,并延长桥梁的使用寿命。
衍生相关工作
dacl10k数据集的发布激发了大量相关研究工作,特别是在桥梁损伤识别和语义分割领域。基于该数据集,研究人员开发了多种语义分割模型,并提出了改进的多标签分类方法。此外,该数据集还促进了无人机和增强现实技术在桥梁检测中的应用,推动了数字化桥梁检测框架的发展。这些衍生工作不仅提升了桥梁检测的自动化水平,还为其他基础设施的损伤检测提供了参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

CosyVoice 2

CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。

arXiv 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录