five

ZeroWaste

收藏
arXiv2022-05-17 更新2024-06-21 收录
下载链接:
http://ai.bu.edu/zerowaste/
下载链接
链接失效反馈
官方服务:
资源简介:
ZeroWaste数据集是由波士顿大学等机构联合创建的,专注于工业级废物检测与分割的首个野外数据集。该数据集包含4661帧高密度标注的图像,用于训练和评估检测与分割模型,以及大量未标注图像用于半监督和自监督学习方法。数据集内容涵盖高度变形和半透明物体,以及物体类别间的细微差异,为自动化视觉识别带来独特挑战。ZeroWaste数据集的应用领域包括提高回收效率、增加利润和保障工人安全,旨在解决废物分类过程中的低效问题。

The ZeroWaste dataset, co-developed by Boston University and other institutions, is the first real-world wild dataset dedicated to industrial-scale waste detection and segmentation. It contains 4,661 densely annotated image frames for training and evaluating detection and segmentation models, along with a large number of unlabeled images designed for semi-supervised and self-supervised learning methods. The dataset covers highly deformed and translucent objects, as well as subtle differences between object categories, presenting unique challenges for automated visual recognition. The application scenarios of the ZeroWaste dataset include improving recycling efficiency, boosting profits, and ensuring worker safety, with the core objective of addressing inefficiencies in the waste sorting process.
提供机构:
波士顿大学
创建时间:
2021-06-05
搜集汇总
数据集介绍
main_image_url
构建方式
在材料回收设施的实际工业环境中,ZeroWaste数据集的构建体现了严谨的工程化流程。研究团队于马萨诸塞州单流回收设施的高质量纸品传送带上部署了两套紧凑型记录装置,分别位于传送带起始端与末端,以同步捕获未分拣与已分拣区域的视频流。为适应设施空间限制并减少机械振动干扰,装置采用独立平台搭载GoPro Hero 7相机,辅以减震垫与配重基座确保稳定性,并配备扩散光源维持光照均匀性。原始视频经过旋转校正、鱼眼畸变消除、运动去模糊等预处理后,通过专业标注团队对4661帧图像进行多边形实例分割标注,涵盖纸板、软塑料、硬塑料与金属四类材料,标注一致性经专家审核后达到94%以上。
特点
该数据集的核心特征在于其高度真实的工业场景复杂性与专业标注体系。相较于现有简化背景的废弃物数据集,ZeroWaste呈现了极端杂乱场景中高度形变、半透明物体的检测挑战,其图像中平均每帧包含多个相互遮挡的物体实例。数据集创新性地构建了多层次监督范式:包含完整实例标注的ZeroWaste-f子集、6212帧未标注图像的ZeroWaste-s半监督子集,以及基于传送带前后状态对比的ZeroWaste-w弱监督子集。特别值得注意的是,为解决类别不平衡问题,通过域适应技术将TACO数据集的稀有类别物体融合生成ZeroWasteAug增强版本,这种多模态数据架构为不同监督强度的算法研究提供了系统化基准。
使用方法
该数据集为计算机视觉领域提供了多层次的研究平台。在完全监督学习层面,研究者可利用ZeroWaste-f的实例分割标注训练目标检测与语义分割模型,其MS COCO格式兼容主流深度学习框架。针对数据效率优化需求,ZeroWaste-s支持半监督与自监督方法的探索,通过大量未标注数据提升模型泛化能力。而ZeroWaste-w独特的二分类标注体系为弱监督学习开辟了新路径,仅需图像级标签即可训练前景分割模型。实验基准表明,传统方法如Mask R-CNN在该数据集上表现受限,这促使研究者开发适应极端杂乱场景的新型算法,特别是在小目标检测、形变物体识别等挑战性任务中推进技术进步。
背景与挑战
背景概述
随着全球城市化进程加速,废弃物产量持续攀升,高效回收技术成为缓解环境压力的关键。2022年,由波士顿大学、麻省理工学院-IBM沃森人工智能实验室等机构联合发布的ZeroWaste数据集,旨在应对工业场景中可变形物体分割的核心难题。该数据集聚焦于材料回收设施中高度杂乱场景下的废弃物检测与分割,通过采集真实分拣流水线视频,提供了首个工业级、野外环境下的密集标注样本。其创建不仅填补了该领域高质量公开数据的空白,更推动了计算机视觉在非人本中心场景下的算法研究,为机器人抓取、自动化分拣等应用奠定了数据基础。
当前挑战
ZeroWaste数据集致力于解决极端杂乱场景下的可变形物体分割问题,其核心挑战在于物体高度变形、半透明材质普遍存在,以及类别间细微差异难以区分。在构建过程中,数据采集面临工业环境约束,需设计紧凑、抗振的录制装置以适应狭窄空间;标注环节因场景复杂、专业性强,无法依赖众包平台,必须由经过训练的专家完成,导致标注成本高昂且周期漫长。此外,数据流随季节与设施变化而产生的域偏移,要求算法具备标签高效性与自适应能力,进一步增加了模型泛化的难度。
常用场景
经典使用场景
在计算机视觉领域,尤其是在复杂场景下的目标检测与语义分割研究中,ZeroWaste数据集提供了一个极具挑战性的真实工业场景基准。该数据集主要被用于开发和评估在高度杂乱、遮挡严重的环境中,对高度可变形及半透明物体进行精确分割与检测的算法。其经典应用场景聚焦于模拟真实材料回收设施中的传送带图像分析,研究者通过该数据集训练模型,以识别和分割混杂在大量纸质背景中的硬纸板、软塑料、硬塑料和金属等四类可回收物。
实际应用
该数据集最直接且重要的实际应用在于赋能自动化废物分拣系统。通过基于ZeroWaste训练的视觉模型,可以集成到材料回收设施的机器人分拣流水线中,实现对传送带上混杂废物的实时、精准识别与定位。这不仅能够显著提升分拣效率与回收率,降低运营成本,还能替代部分危险环境下的人工分拣,保障工人安全,减少接触医疗废弃物等有害物品的风险。其技术路径为构建更智能、高效的循环经济基础设施提供了核心视觉感知支持。
衍生相关工作
ZeroWaste数据集的发布催生了一系列围绕复杂场景分割与高效学习范式的研究工作。在方法学层面,它促进了针对其数据特性的算法改进,例如利用其提供的未标注数据(ZeroWaste-s)探索对比学习、均值教师框架等半监督策略,以及利用其“前后”对比数据(ZeroWaste-w)发展基于图像级标签的弱监督分割技术。同时,为缓解其固有的类别不平衡问题,相关研究借鉴了其提出的ZeroWasteAug数据增强策略,探索了跨域实例增广等技术,这些工作共同推动了在有限标注下提升模型在复杂工业场景中性能的研究方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作