five

30类家庭垃圾图像(HGI-30)

收藏
arXiv2022-02-24 更新2024-06-21 收录
下载链接:
http://doi.org/10.5281/zenodo.4646699
下载链接
链接失效反馈
官方服务:
资源简介:
30类家庭垃圾图像(HGI-30)数据集由合肥大学人工智能与大数据学院创建,包含18,000张图像,涵盖30种常见家庭垃圾类别。数据集中的图像具有复杂的背景、不同的光照、分辨率和角度,旨在模拟真实世界中的多样性和复杂性。创建过程中,专家团队对每张图像进行了专业的捕捉和标注。HGI-30数据集主要用于家庭垃圾的图像分类和识别研究,旨在通过提供一个公开、稳定的数据集,推动深度学习在环境?;ち煊虻挠τ?,解决家庭垃圾分类中的识别难题。

The Household Garbage Image Dataset (HGI-30) was developed by the School of Artificial Intelligence and Big Data of Hefei University. It comprises 18,000 images covering 30 common household waste categories. The images in this dataset feature complex backgrounds, variable lighting conditions, different resolutions and multiple shooting angles, aiming to simulate the diversity and complexity of real-world scenarios. During the dataset construction, a team of experts conducted professional capture and annotation for each image. The HGI-30 dataset is primarily used for research on image classification and recognition of household waste, with the goal of promoting the application of deep learning in environmental-related fields and solving the recognition challenges in household waste classification by providing a public and stable dataset.
提供机构:
合肥大学人工智能与大数据学院
创建时间:
2022-02-24
搜集汇总
数据集介绍
main_image_url
构建方式
在家庭垃圾图像识别领域,现有数据集常因规模有限或场景单一而难以支撑深度模型的稳健训练。HGI-30数据集的构建过程系统模拟了真实环境中的复杂条件,通过采集30类常见家庭垃圾共计18,000幅图像,每类样本均涵盖四种拍摄视角、三种背景环境及三种光照强度。数据采集后,针对苹果核、牙刷等难获取样本,研究团队进一步采用旋转缩放、高斯噪声与椒盐噪声注入、亮度调节等数据增强技术,有效扩充了样本多样性并提升了模型对空间变换的鲁棒性。
特点
该数据集的核心特征体现在其多维度的环境变量控制与精细的标注体系。图像内容覆盖了固定形状与可变形态、规则纹理与复杂表面的垃圾对象,分辨率范围从300×400至3000×4000像素,同时包含单目标与多目标检测场景。数据集中特别引入了视角、背景、光照、分辨率、增强策略与目标数量六类变异因素,每张图像均由计算机视觉专家进行专业标注,为分类与检测任务提供了高质量的真实标签。这种设计使得数据集能够充分反映现实场景中因光照变化、背景干扰及物体形变带来的识别挑战。
使用方法
HGI-30数据集适用于垃圾图像分类与目标检测两大任务。在分类任务中,研究者可将数据集按4:1比例划分为训练集与验证集,利用在ImageNet上预训练的卷积神经网络进行迁移学习,通过微调全连接层适配30类垃圾分类。检测任务则支持以PASCAL VOC预训练模型为基础,在标注边界框的数据上进行模型训练与评估,评估指标采用交并比阈值为0.5时的平均精度均值。实验表明,结合数据增强与预训练权重的EfficientDet等先进架构在该数据集上取得了显著性能提升,为算法比较提供了可靠基准。
背景与挑战
背景概述
随着环境保护意识的提升,家庭垃圾分类作为资源回收的关键环节,日益受到学术界与工业界的关注。然而,该领域长期缺乏公开、稳定且规模充足的数据集,严重制约了基于深度学习的图像识别算法的研发与应用。在此背景下,合肥大学吴志泽、王晓峰等研究人员于2022年构建了HGI-30数据集,旨在为家庭垃圾图像分类与检测提供标准化基准。该数据集包含30类常见家庭垃圾,共计18,000张图像,通过模拟不同光照、背景、视角与形态,真实反映了现实场景中的复杂性,为相关研究提供了重要的数据支撑,推动了计算机视觉在环保领域的深入应用。
当前挑战
HGI-30数据集致力于解决家庭垃圾图像识别中的核心挑战,即如何在复杂背景、多变光照、多样形态及不规则纹理条件下实现精准分类与检测。构建过程中,研究人员面临多重困难:一是垃圾样本本身具有高度多样性,如香蕉皮等易腐垃圾随时间和环境变化呈现显著的颜色与形状差异;二是数据采集需涵盖多视角、多背景及多光照条件,以增强数据集的泛化能力;三是针对样本稀少的类别,需通过旋转、噪声添加和光照调整等数据增强技术来平衡类别分布,确保深度学习模型的有效训练。这些挑战共同塑造了数据集的现实性与实用性。
常用场景
经典使用场景
在计算机视觉与环境保护的交叉领域,家庭垃圾图像识别面临着复杂背景、多变光照和形态差异等严峻挑战。HGI-30数据集通过模拟真实场景中的六种视觉变异因素,为深度学习模型提供了标准化的评估基准。该数据集最经典的使用场景在于作为卷积神经网络在垃圾图像分类与检测任务中的性能试金石,研究者通过在其18,000张标注图像上训练模型,能够系统评估算法在复杂环境下的鲁棒性与泛化能力。
衍生相关工作
该数据集的发布催生了一系列垃圾识别领域的创新研究。基于HGI-30的基准测试结果,研究者们开始探索更高效的网络架构改进方案,例如结合注意力机制的轻量化网络设计。部分工作聚焦于小目标垃圾检测难题,通过改进特征金字塔结构提升对不规则形状物体的识别精度。此外,该数据集还被用于跨域迁移学习研究,探索将自然图像识别模型有效适配到垃圾识别领域的技术路径,推动了计算机视觉技术在环境保护中的深度应用。
数据集最近研究
最新研究方向
在智能环保与计算机视觉交叉领域,HGI-30数据集的推出为家庭垃圾图像识别研究注入了新的活力。该数据集凭借其涵盖30类常见生活垃圾、总计18000张图像的规模,以及模拟复杂背景、多变光照、多样视角和形态的精心设计,迅速成为评估深度学习模型鲁棒性与泛化能力的重要基准。前沿研究聚焦于利用先进的卷积神经网络架构,如EfficientDet和YOLOv4,通过迁移学习与数据增强策略提升对小目标及不规则形状垃圾的检测精度。同时,学者们正探索多任务学习与轻量化模型部署,以推动智能垃圾分类系统在真实场景中的实用化,助力环境保护与资源循环利用。
相关研究论文
  • 1
    New Benchmark for Household Garbage Image Recognition合肥大学人工智能与大数据学院 · 2022年
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务