five

WaDaBa Dataset

收藏
arXiv2024-12-29 更新2025-01-02 收录
下载链接:
https://github.com/sumn2u/wadaba-analysis
下载链接
链接失效反馈
官方服务:
资源简介:
WaDaBa数据集由塞利纳斯大学科学与文学学院等机构创建,旨在通过深度学习技术解决塑料废物分类问题。该数据集包含4000张高分辨率RGB图像,涵盖五种树脂识别码(RIC)类别:PET、PE-HD、PP、PS和其他。数据集通过数据增强技术扩展至11000张图像,以解决类别不平衡问题。数据集的创建过程包括图像采集、标注和数据增强,最终用于训练和测试深度学习模型,特别是YOLO系列模型。该数据集的应用领域主要集中在废物管理和回收,旨在通过自动化技术提高塑料废物分类的效率和准确性。

The WaDaBa dataset was developed by institutions including the Faculty of Science and Literature of Selinus University and other relevant organizations, aiming to solve plastic waste classification problems via deep learning technologies. This dataset contains 4,000 high-resolution RGB images covering five Resin Identification Code (RIC) categories: PET, PE-HD, PP, PS, and others. To address the class imbalance issue, the dataset was expanded to 11,000 images through data augmentation techniques. The creation process of the dataset includes image collection, annotation and data augmentation, and it is ultimately used for training and testing deep learning models, especially YOLO-series models. The application fields of this dataset mainly focus on waste management and recycling, with the goal of improving the efficiency and accuracy of plastic waste classification through automated technologies.
提供机构:
塞利纳斯大学科学与文学学院, 奥巴费米·阿沃洛沃大学, 伊巴丹大学
创建时间:
2024-12-29
搜集汇总
数据集介绍
main_image_url
构建方式
WaDaBa数据集的构建基于对塑料废物分类的深度需求,涵盖了4000张高分辨率RGB图像,这些图像代表了五种不同的树脂识别码(RIC)类别:PET、PE-HD、PP、PS和其他。图像在多种光照条件和角度下拍摄,并通过数据增强技术(如随机缩放、旋转、对比度调整和翻转)扩展至11000张,以解决类别不平衡问题。所有图像均使用annotate-lab进行标注,并转换为YOLO格式,最终按80:20的比例划分为训练集和测试集。
特点
WaDaBa数据集的特点在于其多样性和复杂性,涵盖了多种塑料类型、颜色和变形程度。数据集的类别分布存在显著不平衡,PET类别占55%,而“其他”类别仅占1%。通过数据增强和过采样技术,数据集得以扩展,提升了模型的泛化能力。此外,数据集的高分辨率(1920x1277像素,300 dpi)确保了图像细节的丰富性,为深度学习模型提供了高质量的训练素材。
使用方法
WaDaBa数据集主要用于训练和评估深度学习模型,特别是YOLO系列模型和迁移学习模型(如MobileNet V2、ResNet50和EfficientNet)。在使用时,首先对数据集进行预处理,包括图像标注、格式转换和数据增强。随后,模型在训练集上进行训练,并通过测试集评估其性能。评估指标包括准确率、精确率、召回率、F1分数和mAP等。最终,性能最佳的模型可部署于实际塑料废物分类和回收系统中,以实现自动化和高效的废物管理。
背景与挑战
背景概述
WaDaBa数据集由Suman Kunwar等人于2024年创建,旨在通过深度学习技术解决塑料废物分类问题。该数据集包含4000张高分辨率RGB图像,涵盖了五种树脂识别码(RIC)类别,包括PET、PE-HD、PP、PS和其他。这些图像在不同光照条件和角度下拍摄,具有丰富的塑料类型、颜色和变形程度信息。WaDaBa数据集的创建背景源于全球塑料废物管理的迫切需求,尤其是传统手工分类方法的低效性。通过引入深度学习模型,如YOLO和MobileNet V2,该数据集为自动化废物分类提供了新的解决方案,推动了可持续废物管理领域的发展。
当前挑战
WaDaBa数据集在解决塑料废物分类问题时面临多重挑战。首先,数据集中存在显著的类别不平衡问题,PET类别占55%,而“其他”类别仅占1%,这可能导致模型在训练过程中对少数类别的识别能力不足。其次,尽管数据增强技术如随机缩放、旋转和对比度调整被用于提高模型的泛化能力,但如何有效处理复杂背景和多样化的塑料形态仍是一个难题。此外,尽管YOLO模型在实时检测中表现出色,但如何在保持高精度的同时降低计算成本,尤其是在资源受限的环境中部署模型,仍需进一步优化。这些挑战不仅影响了模型的性能,也对数据集的扩展和应用提出了更高的要求。
常用场景
经典使用场景
WaDaBa数据集在塑料废物分类领域具有广泛的应用,尤其是在深度学习模型的训练与评估中表现突出。该数据集包含了4000张高分辨率图像,涵盖了五种常见的塑料树脂识别码(RIC)类别,为研究者提供了一个标准化的基准。通过使用卷积神经网络(CNN)和YOLO(You Only Look Once)等深度学习模型,WaDaBa数据集被用于开发高效的塑料废物分类算法,特别是在实时检测和自动化废物管理系统中展现了其独特的价值。
衍生相关工作
WaDaBa数据集催生了一系列相关研究和技术创新。例如,基于该数据集的YOLO模型优化研究,进一步提升了实时检测的精度和效率。此外,研究者还开发了多种数据增强技术和类别平衡方法,以应对数据集中的类别不平衡问题。这些工作不仅扩展了WaDaBa数据集的应用范围,还为其他废物分类数据集的研究提供了宝贵的经验。同时,基于WaDaBa数据集的研究成果也被广泛应用于智能城市和环保项目中,推动了废物管理技术的进步。
数据集最近研究
最新研究方向
在塑料废物管理领域,WaDaBa数据集的最新研究方向聚焦于深度学习模型的应用,特别是YOLO系列模型在塑料废物分类中的表现。研究表明,YOLO-11n和YOLO-11m在准确率和平均精度(mAP)方面表现尤为突出,分别达到了98.03%和0.992的mAP50值。这些模型不仅展示了高精度的分类能力,还在计算效率上取得了显著平衡,使其成为实际部署中的理想选择。此外,轻量级模型如MobileNet V2在资源受限的环境中也表现出色,达到了97.12%的准确率,尽管在目标检测任务中稍显不足。这些研究结果不仅推动了塑料废物分类技术的进步,还为可持续废物管理提供了可扩展的解决方案。通过结合数据增强和类别平衡技术,研究进一步提升了模型的泛化能力,为未来开发实时自动化废物管理系统奠定了基础。
相关研究论文
  • 1
    Plastic Waste Classification Using Deep Learning: Insights from the WaDaBa Dataset塞利纳斯大学科学与文学学院, 奥巴费米·阿沃洛沃大学, 伊巴丹大学 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作