five

5,592 Plastic Bottles in Rivers Dataset

收藏
github2024-04-16 更新2024-05-31 收录
下载链接:
https://github.com/m0-n/Plastic-Bottles-Dataset
下载链接
链接失效反馈
资源简介:
这是一个包含5,592个河流中漂浮的塑料瓶标签的数据集,旨在构建一个对象检测模型,以发现和量化河流中的塑料污染。

This dataset comprises 5,592 images of plastic bottle labels floating in rivers, designed to facilitate the development of an object detection model aimed at identifying and quantifying plastic pollution in riverine environments.
创建时间:
2020-06-01
原始信息汇总

5,592 Plastic Bottles in Rivers Dataset 概述

数据集基本信息

  • 名称: 5,592 Plastic Bottles in Rivers Dataset
  • 描述: 包含5,592张标记的河流中塑料瓶图片,用于训练物体检测模型以量化河流中的塑料污染。
  • 总图像数: 5,592
  • 平均每图像瓶子数: 5.6
  • 图像格式: JPG
  • 总图像文件大小: 2.6 GB
  • 拍摄地点: 34个会话
  • 涉及国家: 孟加拉国、波斯尼亚、印度、印度尼西亚、尼泊尔、巴基斯坦、苏丹
  • 相机视角: 河流侧面(主要)
  • 标记格式: Pascal
  • 许可证: 公共领域

数据集内容结构

文件夹ID 国家 图像数量 标签数量
001 印度尼西亚 14 62
002 印度尼西亚 6 80
... ... ... ...
034 巴基斯坦 27 148

模型性能

  • 平均精度: 0.541
  • 精确度: 92%
  • 召回率: 42%
  • 最佳预处理方法: 3x3 Tiling
  • 模型适用设备: 边缘设备,如Raspberry Pi

数据收集

  • 拍摄指导: 相机始终以90度角对准河流,不使用相机变焦,拍摄大量图片。
  • 拍摄时间: 仅在白天进行,未在夜间或恶劣天气条件下拍摄。
  • 拍摄设备: 使用手机和相机,未使用三脚架。

标记过程和统计

  • 标记工具: labelImg
  • 二次检查: 由另一人进行
  • 标签分布: 从单个瓶子到多个瓶子的图像均有,其中包含9个或更多瓶子的图像占所有标签的53.9%。

预处理建议

  • 建议的预处理方法: 2x2和3x3 Tiling,以增加训练数据量和瓶子在图像中的相对大小。
  • 不建议的预处理方法: Mosaic, 随机图像和标签框旋转,以及增加对比度。

模型测试

  • 测试硬件: Raspberry Pi 4B (1.5 GHz 64-Bit-Quad-Core, 4GB LPDDR4-3200 SDRAM, 64 GB SSD, 3-4 Watt) 配备Intel Neural Compute Stick 2。
  • 测试目的: 在类似实际应用场景的有限计算能力和能源供应的设备上测试模型。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建过程始于对河流塑料污染问题的深入研究,旨在通过图像数据捕捉河流中的塑料瓶。数据采集过程历时两个月,摄影师在不同地点、不同时间拍摄了大量照片,确保了数据的多样性和代表性。拍摄时,摄影师被要求以90度角拍摄河流,避免使用变焦,并在不同光照条件下拍摄,以捕捉塑料瓶在不同距离和环境中的状态。随后,通过手动去重和旋转图像以适应人类视角,最终筛选出5,592张图像。这些图像经过标注,每个塑料瓶都被标记为矩形框,并由另一人进行复核,确保标注的准确性。
使用方法
用户可以通过克隆GitHub仓库或下载ZIP文件获取数据集。数据集可用于训练对象检测模型,以识别和量化河流中的塑料污染。此外,数据集还附带了一个预训练模型,用户可以直接下载并应用于资源受限的设备,如Raspberry Pi。为了提高模型的检测精度,建议使用3x3的图像分块预处理方法。用户还可以根据需要对数据进行进一步的预处理,如调整对比度或使用随机旋转等技术,以优化模型性能。
背景与挑战
背景概述
随着全球塑料污染问题日益严重,河流作为塑料运输的主要途径之一,其研究却相对不足。'5,592 Plastic Bottles in Rivers Dataset'由匿名研究者创建,旨在通过提供5,592张标注的河流塑料瓶图像,推动对河流塑料污染的量化和检测研究。该数据集的核心研究问题是如何在资源受限的设备上,实现对河流中塑料瓶的实时检测,从而为塑料污染的监测提供更为精确和实时的数据支持。该数据集的创建不仅填补了相关领域的研究空白,还为全球塑料污染治理提供了新的技术手段。
当前挑战
该数据集在构建过程中面临多项挑战。首先,数据收集过程中,摄影师需遵循严格的拍摄规则,如避免使用变焦、从不同角度拍摄等,这增加了数据收集的复杂性。其次,数据集中的图像分辨率不一,且塑料瓶在图像中的距离和大小差异显著,这对模型的检测精度提出了高要求。此外,模型在实际应用中的性能可能因环境变化而下降,如何提高模型的鲁棒性和适应性是另一大挑战。最后,尽管数据集提供了丰富的图像和标注,但如何有效利用这些数据进行模型训练,以实现高效的塑料瓶检测,仍需进一步研究和优化。
常用场景
经典使用场景
5,592 Plastic Bottles in Rivers Dataset 主要用于河流中塑料瓶的检测与量化。该数据集通过提供大量标注的河流图像,支持开发高效的物体检测模型,以识别和统计河流中的塑料污染。经典的使用场景包括在资源受限的设备上进行实时检测,如使用 Raspberry Pi 等边缘设备,从而实现对河流塑料污染的实时监控和数据收集。
解决学术问题
该数据集解决了全球塑料污染研究中一个关键的学术问题,即如何精确量化河流中的塑料排放。传统的塑料排放估算主要依赖于数学模型,缺乏实际测量数据的支撑,导致结果不够精细且难以操作。通过提供大量真实世界的图像数据,该数据集为研究人员提供了一个可靠的基础,用于开发和验证能够实时检测河流中塑料污染的算法,从而提高塑料污染监测的准确性和可操作性。
实际应用
在实际应用中,5,592 Plastic Bottles in Rivers Dataset 可用于开发智能监控系统,帮助环保组织和政府机构实时监测河流中的塑料污染情况。例如,该数据集可用于构建自动化的河流监测设备,部署在河流沿岸或无人机上,实时采集数据并生成污染报告。此外,该数据集还可用于培训和优化机器学习模型,使其能够在资源受限的环境中高效运行,如在偏远地区或发展中国家进行塑料污染监测。
数据集最近研究
最新研究方向
近年来,河流塑料污染问题日益受到关注,尤其是在全球范围内塑料排放的监测与量化方面。5,592 Plastic Bottles in Rivers Dataset 数据集的推出,为这一领域的研究提供了宝贵的资源。该数据集不仅包含了大量河流中塑料瓶的标注图像,还提供了基于这些数据训练的对象检测模型,旨在帮助研究人员开发能够在资源受限设备上运行的塑料污染检测系统。前沿研究方向主要集中在通过改进图像预处理技术(如3x3分块)来提升模型的检测精度,以及探索如何在边缘设备上实现高效的实时检测。此外,该数据集的跨地域特性也为全球河流塑料污染的比较研究提供了基础,进一步推动了塑料污染治理的精细化与科学化。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作