five

Yorai/detect-waste_loading_script

收藏
Hugging Face2023-09-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yorai/detect-waste_loading_script
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: config_name: taco-multi features: - name: image_id dtype: int64 - name: image dtype: image - name: width dtype: int32 - name: height dtype: int32 - name: objects sequence: - name: id dtype: int64 - name: area dtype: int64 - name: bbox sequence: float32 length: 4 - name: category dtype: class_label: names: '0': metals_and_plastic '1': other '2': non_recyclable '3': glass '4': paper '5': bio '6': unknown splits: - name: train num_bytes: 1006510 num_examples: 3647 - name: test num_bytes: 248312 num_examples: 915 download_size: 10265127938 dataset_size: 1254822 language: - en tags: - climate pretty_name: detect-waste size_categories: - 1K<n<10K --- # Dataset Card for detect-waste ## Dataset Description - **Homepage: https://github.com/wimlds-trojmiasto/detect-waste** ### Dataset Summary AI4Good project for detecting waste in environment. www.detectwaste.ml. Our latest results were published in Waste Management journal in article titled Deep learning-based waste detection in natural and urban environments. You can find more technical details in our technical report Waste detection in Pomerania: non-profit project for detecting waste in environment. Did you know that we produce 300 million tons of plastic every year? And only the part of it is properly recycled. The idea of detect waste project is to use Artificial Intelligence to detect plastic waste in the environment. Our solution is applicable for video and photography. Our goal is to use AI for Good. ### Supported Tasks and Leaderboards Object Detection ### Languages English ### Data Fields https://github.com/wimlds-trojmiasto/detect-waste/tree/main/annotations ## Dataset Creation The images are post processed to remove exif and reorient as required. Some images are labelled without the exif rotation in mind thus they're not rotated at all but have their exif metadata removed ### Personal and Sensitive Information **BEWARE** This repository had been created by a third-party and is not affiliated in any way with the original detect-waste creators/ ## Considerations for Using the Data ### Licensing Information https://raw.githubusercontent.com/wimlds-trojmiasto/detect-waste/main/LICENSE

# detect-waste 数据集卡片 ## 数据集概述 - **主页:https://github.com/wimlds-trojmiasto/detect-waste** ### 数据集摘要 本数据集属于AI4Good(人工智能向善,Artificial Intelligence for Good)项目,用于检测自然环境中的垃圾,项目官网为www.detectwaste.ml。 本团队最新研究成果已发表于《Waste Management》期刊,论文题为《基于深度学习的自然与城市环境垃圾检测》。更多技术细节可参考本团队的技术报告《波美拉尼亚垃圾检测:用于自然环境垃圾检测的非营利项目》。 你是否知晓:全球每年生产3亿吨塑料,而仅有部分得到了妥善回收。 本“垃圾检测”项目的核心思路是借助人工智能(Artificial Intelligence,AI)识别自然环境中的塑料垃圾,方案可适配图像与视频数据,项目宗旨为践行AI向善理念。 ### 支持任务与排行榜 目标检测(Object Detection) ### 语言 英语 ### 数据字段 数据字段详情可参考:https://github.com/wimlds-trojmiasto/detect-waste/tree/main/annotations ## 数据集构建 图像已进行后处理:移除EXIF元数据并根据需要调整朝向。部分图像在标注时未考虑EXIF旋转信息,因此未进行旋转操作,但已移除其EXIF元数据。 ### 个人与敏感信息 【注意】本仓库由第三方创建,与原始detect-waste项目的主创团队无任何关联。 ## 数据使用注意事项 ### 许可信息 许可协议详情请见:https://raw.githubusercontent.com/wimlds-trojmiasto/detect-waste/main/LICENSE --- 数据集信息: 配置名称:taco-multi 特征: - 特征名:图像ID(image_id),数据类型:int64 - 特征名:图像(image),数据类型:图像(image) - 特征名:宽度(width),数据类型:int32 - 特征名:高度(height),数据类型:int32 - 特征名:目标(objects),序列类型,子字段: - 特征名:标识符(id),数据类型:int64 - 特征名:面积(area),数据类型:int64 - 特征名:边界框(bbox),长度为4的float32序列 - 特征名:类别(category),分类标签类型,类别名称如下: '0': 金属与塑料(metals_and_plastic) '1': 其他(other) '2': 不可回收物(non_recyclable) '3': 玻璃制品(glass) '4': 纸类(paper) '5': 生物垃圾(bio) '6': 未知类别(unknown) 数据集划分: - 划分集名称:训练集(train),字节数:1006510,样本数:3647 - 划分集名称:测试集(test),字节数:248312,样本数:915 下载大小:10265127938 字节 数据集总大小:1254822 字节 语言:英语(en) 标签:气候(climate) 友好名称:detect-waste 样本规模类别:1千<样本数<1万
提供机构:
Yorai
原始信息汇总

数据集卡片 for detect-waste

数据集描述

数据集概要

AI4Good项目,用于检测环境中的废物。www.detectwaste.ml。

我们的最新成果已发表在《Waste Management》期刊上,文章标题为“Deep learning-based waste detection in natural and urban environments”。

您可以在我们的技术报告“Waste detection in Pomerania: non-profit project for detecting waste in environment”中找到更多技术细节。

您知道吗?我们每年生产3亿吨塑料,只有一部分被适当回收。

detect waste项目的想法是利用人工智能检测环境中的塑料废物。我们的解决方案适用于视频和摄影。我们的目标是利用AI实现公益。

支持的任务和排行榜

目标检测

语言

英语

数据字段

https://github.com/wimlds-trojmiasto/detect-waste/tree/main/annotations

数据集创建

图像经过后处理以去除exif信息并按需重新定向。一些图像在未考虑exif旋转的情况下进行标记,因此它们完全没有旋转,但已移除其exif元数据。

个人和敏感信息

注意 此仓库由第三方创建,与原始detect-waste创建者没有任何关联。

使用数据时的考虑

许可信息

https://raw.githubusercontent.com/wimlds-trojmiasto/detect-waste/main/LICENSE

搜集汇总
数据集介绍
main_image_url
构建方式
在环境科学与计算机视觉交叉领域,detect-waste数据集通过系统化采集自然与城市环境中的废弃物图像构建而成。其构建过程涉及对原始图像进行后处理,包括移除EXIF元数据并根据需要调整图像方向,确保标注与视觉呈现的一致性。部分图像在标注时未考虑EXIF旋转信息,因此仅去除元数据而保留原始方向,这一处理平衡了数据一致性与标注效率。数据集涵盖训练集与测试集,分别包含3647和915张图像,为废弃物检测任务提供了结构化基础。
特点
该数据集专注于多类别废弃物检测,其核心特点在于精细的对象标注体系。每张图像均包含边界框与类别标签,涵盖金属塑料、玻璃、纸张、生物废弃物、不可回收物及其他等七类,其中未知类别增强了现实场景的包容性。图像分辨率多样,覆盖不同环境条件,体现了自然采集数据的真实性。数据集规模适中,侧重于质量而非数量,标注细节如区域面积与对象ID支持深入的模型评估与比较,为环境监测领域的算法开发提供了可靠基准。
使用方法
使用该数据集时,研究者可通过HuggingFace平台直接加载,并应用于对象检测模型的训练与评估。数据集已预分割为训练集和测试集,支持端到端的深度学习流程,包括数据增强、模型优化及性能验证。用户需注意数据集的第三方托管性质,并遵循原始许可证要求,确保合规使用。该数据集适用于环境废弃物识别、垃圾分类自动化等应用场景,其结构化标注便于集成至现有计算机视觉框架,推动AI在环境保护领域的实际部署。
背景与挑战
背景概述
在环境科学与计算机视觉交叉领域,废弃物检测数据集detect-waste由非营利组织wimlds-trojmiasto于近年主导构建,其核心研究聚焦于利用深度学习技术识别自然与城市环境中的废弃物品。该数据集旨在应对全球塑料污染危机,通过标注多类别废弃物对象,为开发自动化监测系统提供关键数据支撑,相关成果已发表于《Waste Management》期刊,推动了环保人工智能应用的发展。
当前挑战
该数据集致力于解决复杂场景下的废弃物目标检测问题,其挑战在于自然环境光照多变、废弃物形态不规则及背景干扰显著,导致模型泛化能力受限。构建过程中,数据采集面临地理分布不均、标注一致性难以保障的困难,且原始图像EXIF信息处理与旋转校正的差异进一步增加了数据清洗的复杂度。
常用场景
经典使用场景
在环境科学与计算机视觉交叉领域,detect-waste数据集为废物检测任务提供了关键支持。该数据集通过标注自然与城市环境中的图像,涵盖金属塑料、玻璃、纸张、生物质等七类废物,经典应用于训练目标检测模型,以自动识别图像中的废弃物类别与位置。其标注精细,包含边界框与面积信息,为模型在复杂背景下的精准识别奠定基础,尤其适用于评估算法在真实场景中的鲁棒性与泛化能力。
实际应用
在实际应用中,detect-waste数据集被集成于智能监控系统,用于城市街道、海滩或自然保护区的实时废物检测。通过结合视频流与摄影图像,该系统可自动定位废弃物,辅助清洁团队高效部署资源,提升环境治理效率。此外,该数据支持开发移动应用,鼓励公众参与废物报告,增强社区环保意识,体现了技术在可持续发展中的实践价值。
衍生相关工作
基于detect-waste数据集,衍生出多项经典研究工作,如《Deep learning-based waste detection in natural and urban environments》等学术论文,这些成果深入探索了卷积神经网络在废物分类中的优化策略。相关项目进一步扩展了数据规模,融合多源环境图像,推动了迁移学习与轻量化模型的发展,为后续研究如废物量化分析与回收路径规划提供了基础框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作