five

Recycle Trash Dataset

收藏
github2021-12-14 更新2024-05-31 收录
下载链接:
https://github.com/connectfoundation/naverconnect-dataset-trash
下载链接
链接失效反馈
官方服务:
资源简介:
Recycle Trash Dataset是一个收集室内外垃圾照片的数据集,包含21818张照片和107935个对象的标注数据,每个对象都有边界框和分割数据,数据集大小约为120GB。

The Recycle Trash Dataset is a collection of indoor and outdoor trash photos, comprising 21,818 images and 107,935 annotated objects. Each object is annotated with bounding boxes and segmentation data. The dataset has a total size of approximately 120GB.
创建时间:
2021-11-23
原始信息汇总

数据集概述

  • 名称:Recycle Trash Dataset
  • 创建者:NAVER Connect Foundation
  • 内容:收集了室内外垃圾照片,包含21818张照片和107935个对象的标注数据。
  • 数据类型:每个对象包含边界框和分割数据。
  • 大小:压缩后约120 GB。

数据集内容

  1. 标签

    • 分类:根据标准回收分类标准进行标注。
    • 类别统计
      • 总对象数:107935
      • 类别包括:General trash, Metal, Plastic bag, Glass, Plastic, Styrofoam, Paper, Clothing, Paper pack, Battery, UNKNOWN。
  2. 样本

    • 提供各类垃圾的样本图片。
  3. 数据集结构

    • 目录结构
      • 数据集分为多个批次,每批次包含500张图片和一个json文件。
      • 提供两种类型的文件夹:data(原始图像大小,用于训练)和vis(可视化,用于预览)。
    • Json文件结构
      • 标注信息采用COCO格式。
      • 包含边界框和分割信息。
  4. 许可证

    • 本作品采用<a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Creative Commons Attribution 4.0 International License</a>。
搜集汇总
数据集介绍
main_image_url
构建方式
Recycle Trash Dataset的构建过程基于NAVER Connect Foundation的精心策划与执行。该数据集通过收集室内和室外的垃圾照片,共计21818张,涵盖了107935个对象的标注数据。每个对象均配备了边界框和分割数据,确保了数据的多样性和丰富性。数据集以500张图片为一个批次进行随机采样,每个批次包含一个JSON文件,用于存储标注信息。数据集的构建严格遵循标准回收分类标准,确保了数据的科学性和实用性。
特点
Recycle Trash Dataset以其大规模和高精度标注而著称。数据集包含11个类别的垃圾,如一般垃圾、金属、塑料袋等,每个类别均有详细的标注信息。数据集的压缩版本约为120GB,提供了原始图像和可视化图像两种形式。可视化图像展示了边界框和分割信息,便于用户预览和理解。此外,数据集的标注信息以COCO格式提供,支持多种深度学习框架的直接使用,极大地方便了研究人员的实验和开发工作。
使用方法
使用Recycle Trash Dataset时,用户可通过数据文件夹和可视化文件夹获取所需数据。数据文件夹包含原始图像和对应的JSON文件,适用于训练深度学习模型。可视化文件夹则提供了经过处理的图像,便于用户快速浏览和验证标注信息。数据集的JSON文件结构清晰,标注信息以COCO格式存储,用户可直接利用现有工具进行数据处理和分析。此外,数据集遵循Creative Commons Attribution 4.0 International License,用户在使用时需遵守相关许可协议。
背景与挑战
背景概述
Recycle Trash Dataset是由NAVER Connect Foundation创建的一个专注于垃圾分类的数据集,旨在通过计算机视觉技术提升垃圾分类的自动化水平。该数据集包含了21818张室内外垃圾照片,标注了107935个对象,每个对象均提供了边界框和分割数据。数据集的核心研究问题在于如何通过深度学习模型准确识别和分类不同类型的垃圾,从而推动智能垃圾分类系统的发展。该数据集的创建时间为近年,其规模和标注的精细度为相关领域的研究提供了重要的数据支持,尤其在环保技术和智能城市领域具有广泛的应用前景。
当前挑战
Recycle Trash Dataset在解决垃圾分类问题时面临多重挑战。首先,垃圾的形态和外观具有高度多样性,尤其是在不同光照、背景和拍摄角度下,模型的泛化能力受到极大考验。其次,数据集中某些类别的样本数量不均衡,例如电池类仅占0.68%,这可能导致模型在训练过程中对小样本类别的识别能力不足。此外,数据集的构建过程中,标注的复杂性也是一个显著挑战,尤其是对垃圾的分割标注需要高精度,以确保模型能够准确识别垃圾的边界和形状。这些挑战不仅影响了模型的性能,也对数据集的扩展和应用提出了更高的要求。
常用场景
经典使用场景
Recycle Trash Dataset 在计算机视觉领域中被广泛用于垃圾分类和识别的研究。该数据集包含了大量室内外垃圾的图片,每张图片都附有详细的边界框和分割标注数据,为深度学习模型的训练提供了丰富的素材。研究人员可以利用这些数据开发高效的垃圾分类算法,提升自动化垃圾分类系统的准确性和效率。
衍生相关工作
Recycle Trash Dataset 的发布催生了一系列相关研究工作。例如,基于该数据集的深度学习模型在垃圾分类竞赛中取得了显著成果,推动了计算机视觉技术在环保领域的应用。此外,许多研究团队利用该数据集开发了新的实例分割和目标检测算法,进一步提升了垃圾分类的精度和效率。这些工作为后续的研究提供了宝贵的参考和基础。
数据集最近研究
最新研究方向
在环境科学与计算机视觉交叉领域,Recycle Trash Dataset为垃圾分类与回收技术的研究提供了重要支持。该数据集包含21818张室内外垃圾照片及107935个对象的标注数据,涵盖多种垃圾类别,如塑料、金属、玻璃等。近年来,基于该数据集的研究主要集中在深度学习模型的优化与应用,特别是在目标检测与图像分割领域。研究者们通过改进卷积神经网络(CNN)和生成对抗网络(GAN)等算法,显著提升了垃圾分类的自动化水平。此外,该数据集还被广泛应用于智能垃圾桶和自动化回收系统的开发,推动了环保技术的创新与普及。随着全球对可持续发展的关注日益增加,Recycle Trash Dataset在推动绿色科技发展方面具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作