Yorai/detect-waste
收藏Hugging Face2023-09-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yorai/detect-waste
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个AI4Good项目,旨在检测环境中的废物,特别是塑料废物。数据集支持目标检测任务,语言为英语。数据集创建过程中,图像经过后处理以移除exif信息并重新定向。
This dataset is part of an AI4Good project focused on detecting waste in the environment, especially plastic waste. It supports object detection tasks, and the language used for its annotations and related documentation is English. During the dataset's development, all images were post-processed to remove EXIF metadata and properly reoriented.
提供机构:
Yorai
原始信息汇总
数据集概述
数据集描述
数据集摘要
AI4Good项目,用于检测环境中的废物。
支持的任务和排行榜
目标检测
语言
英语
数据字段
- image_id: 图像ID,数据类型为int64
- image: 图像,数据类型为image
- width: 图像宽度,数据类型为int32
- height: 图像高度,数据类型为int32
- objects: 对象序列,包含以下字段:
- id: 对象ID,数据类型为int64
- area: 对象面积,数据类型为int64
- bbox: 边界框,数据类型为float32,长度为4
- category: 类别,数据类型为class_label,包含以下类别名称:
- 0: metals_and_plastic
- 1: other
- 2: non_recyclable
- 3: glass
- 4: paper
- 5: bio
- 6: unknown
数据集创建
图像经过后处理以去除exif信息并根据需要重新定向。一些图像在未考虑exif旋转的情况下进行标记,因此它们根本没有旋转,但已移除其exif元数据。
使用数据的注意事项
许可信息
数据集的许可信息可在以下链接找到:https://raw.githubusercontent.com/wimlds-trojmiasto/detect-waste/main/LICENSE
搜集汇总
数据集介绍

构建方式
在环境科学与计算机视觉交叉领域,detect-waste数据集通过系统化采集自然与城市环境中的废弃物图像构建而成。其构建过程涉及对原始图像进行后处理,包括移除EXIF元数据并根据需要调整方向,部分标注图像在未考虑EXIF旋转的情况下完成标注,因此仅去除元数据而未进行旋转操作。该数据集以目标检测任务为导向,精心标注了每张图像中废弃物的边界框与类别信息,为后续的算法训练与评估奠定了坚实基础。
特点
该数据集涵盖了3647张训练图像与915张测试图像,总计超过1.78万兆字节的视觉数据。其核心特征在于精细的标注体系,每张图像均包含图像标识、尺寸及对象序列信息,其中对象标注详细记录了标识符、区域面积、归一化边界框坐标以及七种废弃物类别,包括金属塑料、其他、不可回收物、玻璃、纸张、生物质及未知类别。这种结构化的标注方式为多类别废弃物检测模型提供了丰富且标准化的训练样本,尤其适用于复杂环境下的细粒度识别任务。
使用方法
研究人员可通过HuggingFace平台直接加载该数据集,利用其预划分的训练集与测试集进行模型开发与验证。数据集适用于目标检测任务,用户可依据标注的边界框与类别信息训练深度学习模型,以实现自然与城市环境中废弃物的自动识别。使用前需注意数据许可协议,并参考原始技术报告以获取更详细的标注规范与技术细节,确保模型训练与评估过程的准确性与可复现性。
背景与挑战
背景概述
在环境科学与计算机视觉交叉领域,废弃物检测已成为应对全球塑料污染挑战的关键研究方向。Yorai/detect-waste数据集由非营利组织wimlds-trojmiasto于近年主导构建,其核心研究目标在于通过深度学习技术识别自然环境与城市景观中的废弃物。该数据集收录了涵盖金属塑料、玻璃、纸张等七类废弃物的标注图像,相关成果已发表于《Waste Management》期刊,为生态监测与智能垃圾分类系统提供了重要的基准数据,推动了人工智能在环境保护领域的实际应用。
当前挑战
该数据集致力于解决复杂场景下的废弃物目标检测问题,其核心挑战在于自然环境中光照变化、遮挡现象及废弃物形态多样性导致的识别精度下降。构建过程中,数据采集面临地理分布不均与样本类别不平衡的困难,部分图像因EXIF元数据去除与方向校正不一致,导致标注与图像实际朝向存在偏差。此外,跨场景泛化能力与细粒度分类精度仍是当前算法应用中的关键瓶颈。
常用场景
经典使用场景
在环境科学与计算机视觉交叉领域,Yorai/detect-waste数据集为废物检测任务提供了关键支持。该数据集通过标注图像中的废物对象及其类别,如金属塑料、玻璃、纸张等,广泛应用于目标检测模型的训练与评估。研究者利用该数据集开发算法,以自动识别自然环境与城市环境中的废弃物品,推动智能环境监测系统的进步。
解决学术问题
该数据集有效应对了环境废物自动识别中的学术挑战,包括复杂背景下的小目标检测、多类别废物分类以及数据标注一致性等问题。通过提供高质量标注图像,它助力于提升深度学习模型在真实场景中的泛化能力与鲁棒性,为废物管理研究提供了标准化基准,促进了计算机视觉技术在生态保护领域的深入应用。
衍生相关工作
基于该数据集,多项经典研究工作得以衍生,包括在Waste Management期刊上发表的深度学习方法论文,以及开源社区中的技术报告如'Waste detection in Pomerania'。这些工作不仅优化了YOLO、Faster R-CNN等目标检测架构在废物识别中的性能,还促进了跨领域合作,将AI技术应用于公益项目,为全球环境治理贡献了创新解决方案。
以上内容由遇见数据集搜集并总结生成



