five

TrashSegment

收藏
github2025-03-03 更新2025-03-04 收录
下载链接:
https://github.com/andidprastyo/TrashSegment
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于评估YOLOv8、YOLOv12和U-Net在语义分割任务中的表现,包含图像和相应的标注信息。

This dataset is used to evaluate the performance of YOLOv8, YOLOv12 and U-Net on semantic segmentation tasks, and contains images and their corresponding annotation information.
创建时间:
2025-02-27
原始信息汇总

🔍 语义分割比较:YOLOv8 vs YOLOv12 vs U-Net

本仓库比较了YOLOv8YOLOv12U-Net在语义分割任务上的性能。目标是评估这些模型在自定义数据集上的准确性、速度和资源效率。

🌟 概述

本项目评估了三种流行的语义分割模型:

  • 🚀 YOLOv8:一种最先进的实时对象检测和分割模型。
  • 🎯 YOLOv12:YOLO系列的最新迭代,针对分割任务进行了优化。
  • 🏥 U-Net:一种在医疗和环境分割中广泛使用的经典架构。

比较重点包括:

  • 📊 准确性:平均交并比(mIoU)。
  • ⏱️ 速度:每张图像的推理时间。
  • 💾 资源使用:GPU内存消耗。

📥 安装

  1. 克隆仓库
  2. 这里下载数据集。
  3. 解压数据并确保遵循以下结构:

data |-- annotations |-- all_annotations.json |-- split_mapping.json |-- images |-- loc1 |-- loc2 .... |-- loc6 |-- pretrained_yolo_models |-- different_train_sizes |-- generalization_loc6 |-- trained_one_location |-- best_model.pt |-- timeseries |-- ts_loc1_1 |-- ts_loc1_2 |-- ts_loc5_1

  1. 使用prepare_data.ipynb准备数据,结构应如下所示:

data |-- annotations |-- split_<trainsize>_<testsize> |-- test |-- images |-- <imageid>.jpg |-- labels |-- <imageid>.txt |-- annotations.json |-- train |-- all_annotations.json |-- split_mapping.json |-- combined_gt_masks |-- loc1.pt |-- loc2.pt ... |-- loc6.pt |-- images |-- loc1 |-- loc2 .... |-- loc6 |-- timeseries |-- ts_loc1_1 |-- ts_loc1_2 |-- ts_loc5_1

🖥️ 使用

使用以下命令运行main.py

python main.py --model YOLO --location 1 --yolo_test_path ./data/annotations/split_80_20/test/images --yolo_model_path ./data/pretrained_yolo_models/best_model.pt --n_to_visualize 10

搜集汇总
数据集介绍
main_image_url
构建方式
TrashSegment数据集旨在通过对比三种先进的语义分割模型——YOLOv8、YOLOv12和U-Net的性能,构建了一个用于评估和研究的自定义数据集。该数据集包含了多个地点(loc1至loc6)的图像及其对应的标注信息,并提供了预训练的模型和用于准备数据的脚本,确保了数据集构建的科学性和实用性。
特点
该数据集的特点在于,它不仅包含了图像和相应的标注数据,还提供了不同训练规模的数据划分、针对特定地点的训练模型以及最佳模型文件,便于研究者针对不同场景和需求进行模型训练和性能评估。此外,数据集的结构清晰,易于加载和处理,确保了研究的便利性和效率。
使用方法
使用该数据集时,用户需先从指定链接下载数据,并按照规定的目录结构进行解压。接着,利用提供的`prepare_data.ipynb`脚本准备数据,最后通过执行`main.py`脚本,并指定相应的参数来运行模型,进行性能评估和结果可视化。这一流程的设计使得数据集易于集成到现有的研究框架中。
背景与挑战
背景概述
TrashSegment数据集是在计算机视觉和机器学习领域为了评估不同语义分割模型性能而创建的。该数据集的创建时间为近期,旨在为研究者提供一个标准的平台,以对比YOLOv8、YOLOv12和U-Net三种模型在语义分割任务上的表现。主要研究人员或机构不详,但该数据集在学术界和技术圈内引起了广泛关注,对于推动语义分割技术的进步具有积极影响。其核心研究问题是评估这些模型在准确度、速度和资源效率方面的性能,这对于开发更高效的语义分割算法具有重要意义。
当前挑战
该数据集面临的挑战主要在于:1) 多模型对比的领域问题,即如何确保不同模型在相同条件下公平比较,并准确评估其在语义分割任务中的性能差异;2) 构建过程中的挑战,包括数据集的多样性、标注质量的一致性,以及模型训练和测试时的资源消耗。此外,数据集的泛化能力也是一个关键挑战,需要确保模型在多个地理位置上的表现一致性和准确性。
常用场景
经典使用场景
TrashSegment数据集作为语义分割任务中的实验平台,其经典使用场景在于对比不同深度学习模型在垃圾类别语义分割任务中的性能。通过精确度、速度和资源效率三个维度的评测,研究人员能够深入理解YOLOv8、YOLOv12和U-Net等模型在处理复杂垃圾图像时的有效性,进而选择最适合特定需求的模型架构。
衍生相关工作
基于TrashSegment数据集的研究衍生了众多相关工作,包括但不限于新型深度学习模型的开发、模型在特定垃圾类型上的优化应用、以及利用该数据集进行的多模型融合实验等,这些工作进一步扩大了数据集的影响力和应用范围。
数据集最近研究
最新研究方向
在计算机视觉领域,尤其是语义分割任务中, TrashSegment 数据集近期成为研究的热点。该数据集用于评估 YOLOv8、YOLOv12 和 U-Net 这三种模型在准确性、速度和资源效率方面的性能。YOLOv12 作为 YOLO 系列的最新版本,针对语义分割任务进行了优化,与经典的 U-Net 架构以及实时检测与分割的 YOLOv8 一同受到关注。研究者通过对比分析,旨在探索这些模型在处理 TrashSegment 数据集时的适用性和有效性,进而推动该领域技术的发展与应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作