five

Sacked Carton Dataset(SCD)

收藏
arXiv2021-04-26 更新2024-07-30 收录
下载链接:
https://github.com/hustgetlijun/RCAN
下载链接
链接失效反馈
官方服务:
资源简介:
Sacked Carton Dataset(SCD)是由华中科技大学数字制造装备与技术国家重点实验室创建的大型数据集,专注于物流行业的纸箱检测任务。该数据集包含来自三个不同场景(综合医药物流公司、电子商务物流公司和水果市场)的纸箱图像,共计520张。数据集的创建旨在解决由于不同场景下纸箱的标识、颜色、纹理等不一致导致的域偏移问题,从而提高模型在不同场景下的泛化能力。SCD数据集通过创新的图像合成方法,实现了源数据集中前景纹理与目标数据集纹理的替换,保持了前景对象与背景的上下文关系不变,有效增强了目标数据集。

The Sacked Carton Dataset (SCD) is a large-scale dataset developed by the State Key Laboratory of Digital Manufacturing Equipment and Technology, Huazhong University of Science and Technology, focusing on carton detection tasks in the logistics industry. It contains a total of 520 carton images collected from three distinct scenarios: comprehensive pharmaceutical logistics companies, e-commerce logistics companies, and fruit markets. This dataset was developed to address the domain shift problem caused by inconsistencies in carton markings, colors, textures and other attributes across different scenarios, so as to improve the generalization ability of models across various scenarios. The SCD dataset adopts an innovative image synthesis method to replace the foreground textures in the source dataset with those of the target dataset, while maintaining the contextual relationship between foreground objects and the background, effectively augmenting the target dataset.
提供机构:
华中科技大学数字制造装备与技术国家重点实验室
创建时间:
2021-03-19
原始信息汇总

数据集概述

数据集名称

CDS-FTR

数据集描述

Carton dataset synthesis method for loading-and-unloading carton detection based on deep learning

作者信息

  • Gou, Lijun
  • Wu, Shengkai
  • Yang, Jinrong
  • Yu, Hangcheng
  • Lin, Chenxi
  • Li, Xiaoping
  • Deng, Chao

发表期刊

The International Journal of Advanced Manufacturing Technology

发表年份

2022

数据集使用环境

  • Python 3.5
  • OpenCV
  • PIL (Pillow)
  • Poisson Blending
  • PyBlur

数据集运行脚本

  • 测试表面分割: bash python test_get_surface.py -bf ./data/back -sf ./data/surface

  • 测试轮廓构建: bash python test_construction_surface.py -bf ./data/back -sf ./data/construction

  • 总结果: bash python main.py -ff ./data/fore/img -bf ./data/back -sf ./data/save

搜集汇总
数据集介绍
main_image_url
构建方式
Sacked Carton Dataset (SCD) 的构建基于一种创新的图像合成方法,旨在解决工业应用中目标检测模型因领域转移而泛化能力差的问题。该方法通过前景纹理解耦和替换,将源数据集中的前景纹理替换为目标数据集的纹理,同时保持前景对象与背景的上下文关系不变。具体步骤包括:首先,提出表面分割算法以实现每个实例的纹理解耦;其次,提出轮廓重建算法以保持实例的遮挡和截断关系不变;最后,使用高斯融合算法将源数据集的前景纹理替换为目标数据集的纹理。该方法显著提升了目标领域的检测性能。
特点
SCD 数据集包含来自三个不同场景(综合医药物流公司、电子商务物流公司和水果市场)的纸箱图像。由于领域转移,使用其中一个场景训练的模型在其他场景中表现较差。该数据集的特点在于其通过纹理替换生成的图像具有高度的真实感,且能够有效缓解领域转移问题。此外,SCD 数据集通过纹理解耦和轮廓重建,确保了前景与背景的上下文关系一致,从而提升了模型的泛化能力。
使用方法
SCD 数据集的使用方法主要包括以下几个步骤:首先,使用源数据集中的图像作为基础,通过表面分割算法解耦每个纸箱实例的纹理;其次,使用轮廓重建算法生成完整的轮廓,确保实例的遮挡和截断关系不变;最后,通过高斯融合算法将目标数据集的纹理替换到源数据集的图像中,生成新的训练图像。这些生成的图像可以用于训练目标检测模型,如 RetinaNet 和 Faster R-CNN,以提升模型在目标领域的检测性能。
背景与挑战
背景概述
Sacked Carton Dataset (SCD) 是由华中科技大学数字制造装备与技术国家重点实验室的研究团队于2021年提出的一个专注于纸箱检测的大规模数据集。该数据集包含了来自三个不同场景(综合医药物流公司、电子商务物流公司和水果市场)的纸箱图像,旨在解决工业应用中目标检测模型快速部署时缺乏大规模标注数据的问题。SCD的提出为纸箱检测领域提供了重要的数据支持,尤其是在物流行业的纸箱分拣和堆叠任务中具有广泛的应用前景。然而,由于不同场景下的纸箱图像在纹理、颜色和标志等方面存在显著差异,导致模型在跨场景应用时泛化能力较差,这一问题被称为领域偏移(domain shift)。为了解决这一问题,研究团队提出了一种基于前景纹理解耦与替换的图像合成方法,显著提升了模型在目标领域的检测性能。
当前挑战
SCD数据集面临的主要挑战包括两个方面:首先,领域偏移问题使得模型在跨场景应用时表现不佳。由于不同场景下的纸箱图像在纹理、颜色和标志等方面存在显著差异,模型在源领域训练后难以泛化到目标领域。其次,在数据集的构建过程中,研究团队需要解决前景纹理解耦和替换的技术难题。传统的图像合成方法(如裁剪-粘贴法)虽然能够增加数据量,但无法保持前景与背景之间的上下文关系,导致生成的图像不真实,进而影响模型的泛化能力。为了解决这些问题,研究团队提出了一种新的表面分割算法和轮廓重建算法,通过高斯融合技术实现了前景纹理的替换,同时保持了前景与背景的上下文关系,显著提升了模型的检测精度。
常用场景
经典使用场景
Sacked Carton Dataset (SCD) 主要用于工业环境中的纸箱检测任务,特别是在物流和仓储领域。该数据集通过提供来自不同场景(如医药物流公司、电商物流公司和水果市场)的纸箱图像,帮助研究人员训练和验证目标检测模型。其经典使用场景包括纸箱的自动分拣、堆叠和拆垛等任务,这些任务在物流自动化中至关重要。
实际应用
SCD 在实际应用中具有广泛的潜力,特别是在物流自动化领域。例如,在医药物流公司中,纸箱检测模型可以用于自动化分拣和堆叠系统,提高物流效率并减少人工成本。在电商物流场景中,该数据集可以帮助开发高效的包裹分拣系统,以应对大规模订单处理需求。此外,在水果市场中,纸箱检测技术可以用于自动化装卸和库存管理,进一步提升供应链的智能化水平。
衍生相关工作
SCD 的提出推动了目标检测领域的研究,特别是在域适应和数据增强方面。基于 SCD 的研究工作包括改进的纹理解耦算法、轮廓重建方法以及高斯融合技术的优化。此外,SCD 还启发了其他领域的研究,如基于合成数据的少样本学习和跨域目标检测。这些衍生工作不仅扩展了 SCD 的应用范围,还为解决其他计算机视觉任务中的域适应问题提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作