five

Custom Dataset

收藏
github2023-12-21 更新2024-05-31 收录
下载链接:
https://github.com/wudi-ldd/Fine-Tuning-SAM
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于微调SAM模型,特别适用于图像中目标特定训练的复杂场景。它专注于排除非目标区域,以实现更精确的模型行为。

This dataset is designed for fine-tuning the SAM (Segment Anything Model) model, particularly suited for complex scenarios involving target-specific training in images. It focuses on excluding non-target regions to achieve more precise model behavior.
创建时间:
2023-12-20
原始信息汇总

数据集准备与使用概述

数据集结构

  • 原始图像与标注文件存储:将标注过的图像及其对应的JSON文件存储在datasetsefore目录下。
  • 数据转换
    • 使用json_to_dataset.pyjson_to_dataset_only.py处理标注文件,生成PNG格式的标注掩码和JPEG格式的原始图像。
    • 原始图像存放于datasetsJPEGImages,JSON文件存放于datasetsjson,标注掩码存放于datasetsSegmentationClass

数据集预处理

  • 图像与标注文件的尺寸调整:使用resize.pyjson_scaling.py调整图像和JSON文件的尺寸,确保一致性,存放于VOCdevkitVOC2007相关目录。
  • 数据集划分:通过voc_annotation.py将数据集划分为训练集和验证集,结果存放于VOCdevkitVOC2007ImageSetsSegmentation

模型训练配置

  • 训练文件配置
    • 优化器选择:optimizer_type = "adam"
    • 模型类型:model_type = vit_h
    • 模型路径:model_path = "checkpoint/sam_vit_h_4b8939.pth",需从SAM GitHub Repository下载。
    • 训练迭代次数:epoch = 200
    • 初始学习率:Init_lr = 1e-5
    • 模型保存频率:save_period = 10
    • 训练结果保存目录:save_dir = logs
    • 训练数据集路径:train_dataset_path = VOCdevkit/VOC2007

模型预测

  • 预测执行:使用predict.py进行模型预测。
    • 预测数据集路径:test_dataset_path = img
    • 目标类别指定:label_filter=pore
    • 测试不同边界框尺寸:设置min_scale = 1max_scale = 1
    • 预测结果存放于img_out

模型评估

  • 评估执行:运行Metric Calculation.py计算评估指标,测试图像的真实掩码位于img est,预测结果位于img_out

附加工具

  • extract_matching_images.py:根据txt文件列表从文件夹中提取图像。
  • convert_labels_color.py:调整训练掩码颜色与预测掩码颜色一致。
搜集汇总
数据集介绍
main_image_url
构建方式
Custom Dataset的构建过程围绕图像分割任务展开,首先将标注图像及其对应的JSON文件存储在`datasets\before`文件夹中。通过执行`json_to_dataset.py`或`json_to_dataset_only.py`脚本,将图像和标注转换为PNG格式的语义分割掩码和JPEG格式的原始图像。随后,利用`resize.py`和`json_scaling.py`脚本对图像、掩码和JSON标注进行尺寸归一化,确保数据一致性。最后,通过`voc_annotation.py`脚本将数据集划分为训练集和验证集,为模型训练提供基础。
使用方法
使用Custom Dataset时,首先需将标注图像和JSON文件存储在指定文件夹中,并通过脚本进行格式转换和尺寸归一化。随后,利用`voc_annotation.py`脚本划分训练集和验证集。在模型训练阶段,通过修改`train.py`文件中的参数,如优化器类型、模型路径和训练迭代次数等,启动训练过程。训练完成后,使用`predict.py`脚本进行预测,并通过`Metric Calculation.py`脚本评估模型性能。
背景与挑战
背景概述
Custom Dataset 是为微调 Segment Anything Model (SAM) 而设计的专用数据集,旨在解决复杂场景下的目标特定训练问题。该数据集由研究人员在2023年创建,主要用于图像分割任务,特别是在排除非目标区域的同时,提升模型在特定目标上的精确度。通过提供详细的图像注释和相应的JSON文件,Custom Dataset 为研究人员提供了一个灵活的工具,能够有效支持SAM模型的微调过程。该数据集的推出不仅推动了图像分割领域的技术进步,还为处理复杂场景下的目标识别问题提供了新的解决方案。
当前挑战
Custom Dataset 在构建和应用过程中面临多重挑战。首先,图像分割任务本身具有较高的复杂性,尤其是在处理多目标、遮挡或背景复杂的场景时,模型需要具备极高的鲁棒性和精确度。其次,数据集的构建过程中,图像尺寸的不一致性可能导致注释掩码与原始图像之间的错位,进而影响模型的训练效果。此外,数据集的划分与标注质量直接影响模型的性能,如何确保数据的高质量和一致性是构建过程中的一大难题。最后,模型的微调过程涉及大量超参数的选择与优化,如何在有限的计算资源下高效完成训练,也是研究人员需要克服的技术挑战。
常用场景
经典使用场景
Custom Dataset 主要用于图像分割领域,特别是在需要对特定目标进行精细化分割的场景中。通过微调 Segment Anything Model (SAM),研究人员能够针对复杂图像中的特定目标进行训练,从而排除非目标区域的干扰,提升模型的精确度。该数据集的使用场景涵盖了医学影像分析、自动驾驶中的物体识别以及卫星图像处理等多个领域。
解决学术问题
Custom Dataset 解决了图像分割领域中目标区域与非目标区域难以区分的问题。通过提供精确的标注数据和微调机制,该数据集帮助研究人员优化模型的分割性能,特别是在目标区域复杂且背景干扰较大的情况下。其意义在于推动了图像分割技术的进步,为后续研究提供了高质量的数据支持。
实际应用
在实际应用中,Custom Dataset 被广泛用于医学影像分析,如肿瘤区域的精确分割;自动驾驶领域中的道路标志和行人识别;以及卫星图像中的建筑物和植被分类。这些应用场景要求模型具备高精度的分割能力,而 Custom Dataset 通过微调 SAM 模型,显著提升了模型在实际任务中的表现。
数据集最近研究
最新研究方向
在计算机视觉领域,Custom Dataset的引入为Segment Anything Model (SAM)的微调提供了新的研究方向。该数据集通过精确的标注和复杂的图像处理流程,使得模型能够在特定目标训练中排除非目标区域,从而提升模型的精确度。当前研究热点集中在如何优化数据预处理流程,特别是在图像尺寸归一化和标注文件缩放方面,以确保训练过程中图像与标注的精确对齐。此外,研究还探讨了如何通过调整优化器类型、学习率和模型保存频率等参数,进一步提升模型的训练效率和预测准确性。这些研究不仅推动了SAM模型在复杂场景中的应用,也为图像分割领域的技术进步提供了重要支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作