Stacked Carton Dataset (SCD)
收藏arXiv2021-02-25 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2102.12808v1
下载链接
链接失效反馈官方服务:
资源简介:
Stacked Carton Dataset (SCD) 是一个大规模的公开数据集,专注于各种纸箱布局场景,由华中科技大学数字制造装备与技术国家重点实验室创建。该数据集包含16,136张图像,这些图像从互联网和多种真实场景中收集而来,图像中的实例数量从稀疏到密集分布。SCD分为两个子集:Live Stacked Carton Dataset (LSCD) 和 Online Stacked Carton Dataset (OSCD),分别模拟工业纸箱堆叠场景和现实中的各种通用场景。SCD通过像素级标注,支持深度学习在检测和实例分割任务中的应用,旨在解决自动化物流系统中的纸箱检测问题。
Stacked Carton Dataset (SCD) is a large-scale public dataset focusing on various carton stacking scenarios, created by the State Key Laboratory of Digital Manufacturing Equipment and Technology at Huazhong University of Science and Technology. This dataset contains 16,136 images collected from the Internet and multiple real-world scenarios, with the number of instances in the images ranging from sparse to dense distributions. SCD is divided into two subsets: Live Stacked Carton Dataset (LSCD) and Online Stacked Carton Dataset (OSCD), which simulate industrial carton stacking scenarios and various general real-world scenarios respectively. SCD provides pixel-level annotations to support the application of deep learning in detection and instance segmentation tasks, aiming to address the carton detection problem in automated logistics systems.
提供机构:
华中科技大学数字制造装备与技术国家重点实验室
创建时间:
2021-02-25
搜集汇总
数据集介绍

构建方式
Stacked Carton Dataset (SCD) 是通过从互联网和多个仓库收集图像构建而成的。这些图像被用于训练和评估用于堆叠和卸载纸箱、集装箱中纸箱卸载等应用的纸箱检测模型。SCD 包含 16,136 张图像和 250,000 个实例掩码,其中对象使用逐实例分割进行标记以实现精确定位。
特点
SCD 的主要特点包括:1) 大规模:包含来自互联网和仓库的大量图像,共 16,136 张,其中对象使用逐实例分割进行标记以实现精确定位;2) 多样性:图像中的纸箱数量从稀疏到密集分布,以模拟不同的堆叠场景;3) 高质量:从现场收集的图像具有丰富的纹理信息和较高的分辨率;4) 详细的标签:提供内/外和遮挡信息,将纸箱分为四类,包括 Carton-inner-all、Carton-inner-occlusion、Carton-outer-all 和 Carton-outer-occlusion。
使用方法
SCD 可用于训练和评估纸箱检测模型,支持检测和分割任务。数据集分为两个子集:LSCD 和 OSCD。LSCD 包含从仓库现场拍摄的图像,而 OSCD 包含从互联网下载的图像。用户可以使用 MS COCO 或 PASCAL VOC 格式进行标注,并根据需要进行预训练或微调。SCD 还可用于进行实例分割和目标检测等任务。
背景与挑战
背景概述
在自动化物流系统中,纸箱检测技术扮演着至关重要的角色,广泛应用于纸箱堆垛与卸垛、集装箱中纸箱的卸载等多个应用场景。然而,截至2021年2月,研究界缺乏一个公开的大型纸箱数据集,这严重阻碍了纸箱检测技术的发展。为了推动该领域的前沿研究,华中科技大学的国家数字化制造设备与技术重点实验室的研究人员创建了一个名为Stacked Carton Dataset (SCD)的大型纸箱数据集。SCD包含了从互联网和多个仓库收集的图像,并对每个物体进行了逐实例分割,以实现精确的定位。该数据集共包含16,136张图像和25万个实例掩码,旨在为纸箱检测提供大规模、高质量的训练和评估数据。SCD的创建不仅填补了纸箱数据集的空白,也为基于深度学习的纸箱货物检测提供了前提条件,对自动化物流运输领域产生了深远的影响。
当前挑战
SCD数据集的创建和利用面临着诸多挑战。首先,在解决领域问题方面,现有的数据集大多不包含纸箱类别,或者包含的纸箱图像数量有限,无法模拟真实场景中纸箱的各种排列组合。SCD通过收集大量包含纸箱的图像,并对其进行逐实例分割,有效地解决了这一问题。其次,在构建过程中,研究人员遇到了如何处理分类得分和定位置信度之间严重不平衡的问题。为了解决这个问题,他们提出了Offset Prediction between Classification and Localization module(OPCL),该模块通过预测分类得分和定位置信度之间的差距,并使用这些差距来修改分类置信度,从而提高了检测器的性能。此外,SCD数据集中的纸箱往往具有重复的纹理信息,这会误导模型做出错误的判断。为了解决这个问题,研究人员提出了Boundary Guided Supervision module(BGS),该模块利用边界信息来指导检测器更加关注边界信息,从而提高了纸箱定位的准确性。
常用场景
经典使用场景
在自动物流系统中,纸箱检测是一个至关重要的技术,它可以在许多应用中发挥作用,例如纸箱的堆叠和卸载、集装箱中纸箱的卸载等。然而,目前还没有公开的大规模纸箱数据集可供研究界训练和评估纸箱检测模型,这阻碍了纸箱检测的发展。为了推动纸箱检测领域的最新进展,本文提出了一种名为Stacked Carton Dataset(SCD)的大规模纸箱数据集。SCD包含从互联网和多个仓库收集的图像,并通过实例分割进行精确定位。总共有250,000个实例掩码来自16,136张图像。此外,我们还设计了一个基于RetinaNet的纸箱检测器,通过嵌入边界引导监督模块(BGS)和分类与定位之间的偏移预测模块(OPCL)来提高检测精度。OPCL缓解了分类和定位质量之间的不平衡问题,从而提高了SCD上的AP值。为了展示OPCL对其他数据集的泛化能力,我们在MS COCO和PASCAL VOC上进行了广泛的实验,结果表明,OPCL在MS COCO和PASCAL VOC上的AP值分别提高了1.8% ~ 2.2%和3.4% ~ 4.3%。
实际应用
SCD数据集的实际应用场景非常广泛,主要包括自动物流系统中的纸箱堆叠和卸载、集装箱中纸箱的卸载等。在这些场景中,纸箱检测技术可以有效地提高物流效率,降低人工成本。例如,在纸箱堆叠和卸载过程中,纸箱检测技术可以帮助机器人准确地识别和定位纸箱,从而实现自动化操作。在集装箱中纸箱的卸载过程中,纸箱检测技术可以帮助工人快速准确地找到目标纸箱,提高工作效率。此外,SCD数据集还可以用于其他领域,如机器人、自动驾驶等,为这些领域的发展提供数据支持。
衍生相关工作
基于SCD数据集,研究人员可以开展一系列相关的研究工作。例如,可以研究不同类型的纸箱检测算法,包括基于深度学习的算法和基于传统图像处理方法的算法,并比较它们的性能和优缺点。此外,还可以研究纸箱检测算法在实际应用中的鲁棒性和适应性,以及如何提高算法的检测精度和实时性。另外,还可以研究纸箱检测算法在不同场景下的泛化能力,以及如何通过数据增强和迁移学习等方法提高算法的泛化能力。总之,SCD数据集为纸箱检测领域的研究提供了丰富的数据资源,有望推动该领域的技术发展和应用落地。
以上内容由遇见数据集搜集并总结生成



