SODA: Site Object Detection dAtaset

Name: SODA: Site Object Detection dAtaset
Creator: 华南理工大学土木与交通学院
Published: 2022-02-19 17:09:23
License: 暂无描述

arXiv2022-02-19 更新2024-06-21 收录

下载链接：

https://scut-scet-academic.oss-cn-guangzhou.aliyuncs.com/SODA

下载链接

链接失效反馈

官方服务：

资源简介：

SODA是由华南理工大学土木与交通学院开发的大型建筑工地图像数据集，包含19,846张图像和286,201个对象，涵盖工人、材料、机器和布局四大类共15种对象。数据集通过无人机、手持单眼相机和工地监控视频等多种设备在不同工地条件、天气和施工阶段收集，经过筛选和处理后，由35名土木工程专业学生进行标注。SODA旨在为建筑行业的深度学习对象检测方法提供数据支持，解决建筑工地管理中依赖人工判断的问题，提高安全性和生产效率。

SODA is a large-scale construction site image dataset developed by the School of Civil Engineering and Transportation, South China University of Technology. It contains 19,846 images and 286,201 object instances, covering a total of 15 object categories belonging to four major groups: workers, materials, machinery, and site layouts. The dataset was collected using various devices including unmanned aerial vehicles (UAVs), handheld monocular cameras, and on-site construction surveillance videos, under diverse construction site conditions, weather scenarios, and construction phases. After screening and preprocessing, the dataset was annotated by 35 civil engineering students. SODA aims to provide data support for deep learning-based object detection methods in the construction industry, addressing the issues of relying on manual judgment in construction site management and enhancing safety and production efficiency.

提供机构：

华南理工大学土木与交通学院

创建时间：

2022-02-19

搜集汇总

数据集介绍

构建方式

SODA数据集的构建始于对施工现场常见元素的分类，包括工人、材料、机械和布局四个大类，进一步细分为15个目标检测类别。数据采集采用多种设备，包括单目相机、无人机和施工现场监控视频，从不同角度和时间收集超过20,000张图像。在数据清洗过程中，剔除了重复、模糊、无关和涉及隐私的图像。数据标注采用VOC格式，确保标注质量。最终，SODA数据集包含19,846张图像和286,201个对象。

使用方法

SODA数据集的使用方法包括数据准备、模型训练和评估。首先，将数据集分为训练集和测试集。然后，选择合适的深度学习目标检测算法，如YOLO v3或YOLO v4，进行模型训练。训练过程中，可以使用数据增强技术提高模型的泛化能力。最后，使用mAP等指标评估模型的性能。此外，SODA数据集还可以用于开发新的深度学习目标检测算法，或作为其他相关研究的基准。

背景与挑战

背景概述

随着计算机视觉技术的快速发展，深度学习在物体检测领域的应用越来越广泛。然而，在建筑行业，尽管计算机视觉技术已经显示出巨大的潜力，例如在安全监控、进度分析和人员管理等方面的应用，但目前缺乏大规模、开源的图像数据集，这限制了物体检测算法的发展。为了解决这一问题，Duan等人于2022年构建了一个名为SODA的大型图像数据集，专门用于建筑工地。SODA数据集包含15种物体类别，分为工人、材料、机械和布局四大类。该数据集的构建过程包括类别选择、数据采集、数据清洗和数据标注。数据采集主要采用无人机、手持单目相机拍摄和施工现场监控视频（钩可视化）三种方法，共收集了超过20,000张图像。数据清洗包括去除重复图像、模糊图像、非目标图像以及隐私保护。数据标注采用VOC格式，并遵循严格的标注标准。统计结果表明，SODA数据集在多样性和数量方面具有优势。此外，使用基于深度学习的两个主流物体检测算法（YOLO v3/ YOLO v4）进行评估，结果显示该数据集在典型建筑场景中具有可行性，最高mAP达到81.47%。SODA数据集的创建为建筑行业深度学习物体检测方法的发展做出了贡献，并为该领域相应算法的进一步评估建立了性能基准。

当前挑战

尽管SODA数据集为建筑行业物体检测算法的研究提供了重要的资源，但仍然存在一些挑战。首先，数据集的类别和数量相对于其他深度学习社区的数据集来说仍然较小，需要进一步增加。其次，目前的标注任务仅为物体级别，仅标注了物体的边界框，而非像素级别，限制了数据集在更精确的物体分割算法上的应用。此外，数据集的构建仍然依赖于人工标注，这是一个耗时且劳动密集的过程。未来可以探索更多标注方法，如众包标注和自动标注。最后，数据采集过程也依赖于人工努力，尽管SODA获得的数据质量优于网络爬虫，但收集合适的建筑图像和视频仍然是一个耗时且劳动密集的过程。未来可以尝试与相关建筑行业权威机构合作，以丰富数据集。

常用场景

经典使用场景

SODA数据集被广泛用于深度学习在建筑工地的目标检测算法的开发与评估。通过包含工人、材料、机器和布局等15类对象，该数据集为研究人员提供了一个全面的测试平台，用以验证和优化目标检测算法的性能。例如，基于SODA数据集训练的YOLO v3/v4算法在典型建筑场景中实现了高达81.47%的mAP，展示了数据集的高效性和实用性。

解决学术问题

SODA数据集解决了建筑行业中缺乏大规模、开源目标检测数据集的问题，这对于数据密集型的深度学习算法至关重要。数据集的多样性和丰富性为深度学习目标检测方法的发展提供了有力支持，并为其在建筑行业的应用提供了性能基准。此外，SODA数据集也为建筑工地安全监控、施工进度分析、人员监控、应急响应和文明施工等领域的研究提供了新的可能性。

实际应用

在建筑行业中，SODA数据集的实际应用场景广泛，包括但不限于安全监控、施工进度分析、人员监控等。例如，通过SODA数据集训练的深度学习模型可以识别工人是否佩戴个人防护装备，从而提高工地安全管理水平。此外，该数据集还可以用于监测施工进度，通过识别材料位置和机器状态，为施工管理提供实时数据支持。

数据集最近研究