five

CD-FSOD

收藏
arXiv2023-05-03 更新2024-07-30 收录
下载链接:
https://github.com/FSOD/CD-FSOD
下载链接
链接失效反馈
官方服务:
资源简介:
CD-FSOD数据集是由机器视觉与信号分析中心创建,用于跨域少样本目标检测的研究。该数据集包含三个子数据集:ArTaxOr、UODD和DIOR,分别来自生物学、水下和航空领域,总计约36650条数据。数据集的创建旨在解决在不同领域间进行少样本学习时遇到的挑战,特别是在数据稀缺的情况下如何有效检测新类别。CD-FSOD数据集的应用领域广泛,包括生物图像分析、水下环境监测和航空图像识别等,旨在推动跨域少样本学习技术的发展。

The CD-FSOD dataset was developed by the Machine Vision and Signal Analysis Center for research on cross-domain few-shot object detection. It comprises three subsets: ArTaxOr, UODD, and DIOR, which are derived from the biological, underwater, and aerial domains respectively, with a total of approximately 36,650 data samples. The dataset is designed to address the challenges encountered in cross-domain few-shot learning, particularly how to effectively detect novel categories under data-scarce scenarios. The CD-FSOD dataset covers a wide range of application areas, including biological image analysis, underwater environment monitoring, and aerial image recognition, and aims to advance the development of cross-domain few-shot learning technologies.
提供机构:
机器视觉与信号分析中心
创建时间:
2022-10-11
原始信息汇总

数据集概述

数据集来源

  • 源域数据集: MS COCO

目标域数据集

  • ArTaxOr: 一个昆虫分类数据集
  • UODD: 一个水下物体检测数据集
  • DIOR: 一个光学遥感图像中的物体检测数据集

数据集统计信息

数据集 类别数 训练图像数 测试图像数
ArTaxOr 7 13,991 1,383
UODD 3 3,194 506
DIOR 20 18,463 5,000
搜集汇总
数据集介绍
main_image_url
构建方式
CD-FSOD 数据集的构建旨在解决跨域少样本目标检测的问题。该数据集包含来自不同领域的数据,旨在评估现有少样本目标检测方法在跨域场景下的性能。数据集由一个基础数据集(MS COCO)和三个目标数据集(ArTaxOr、UODD 和 DIOR)组成,每个目标数据集均具有不同的领域特征。模型首先在基础数据集上进行训练,然后在目标数据集上进行适应,每个类别的实例数量仅为 K 个 (K = 1, 5, 10)。
使用方法
使用 CD-FSOD 数据集的方法包括两个阶段:训练阶段和测试阶段。在训练阶段,模型首先使用基础数据集进行训练,然后在微调阶段,模型在目标数据集上进行适应。在微调阶段,模型首先进行预热步骤,即在目标数据集上进行标准的检测监督损失训练。然后,模型进入蒸馏步骤,教师模型和学生模型通过蒸馏损失相互强化,并通过指数移动平均 (EMA) 更新权重。最终损失是监督损失和蒸馏损失的加权和。在测试阶段,模型使用教师模型对测试图像进行推理和评估。
背景与挑战
背景概述
在跨域少样本目标检测(CD-FSOD)领域,Wuti Xiong 等研究人员于 2023 年 5 月 3 日提出了一个名为 CD-FSOD 的基准数据集。该数据集旨在解决现实世界中目标检测的问题,其中目标检测器必须在不同的领域中预训练基础类别,然后在具有少量实例的目标数据集上进行迁移。由于目标检测器在处理跨域数据时容易过拟合,因此研究者们分析了现有方法失败的原因,并引入了一种基于蒸馏的基线方法,以缓解过拟合问题。该基线方法在 CD-FSOD 基准上取得了显著的性能提升。
当前挑战
CD-FSOD 基准数据集的创建带来了两个主要的挑战。首先,现有 FSOD 方法在跨域场景下表现不佳,甚至无法超越简单的微调模型。这表明现有方法无法很好地处理跨域问题,需要开发新的方法。其次,在构建过程中,研究者们面临着如何有效缓解过拟合问题的挑战。他们通过引入一种基于蒸馏的基线方法,实现了学生模型和教师模型之间的相互强化,从而提高了模型的泛化能力。
常用场景
经典使用场景
在计算机视觉领域,目标检测是基础且重要的任务之一。传统的目标检测方法需要大量标注数据来训练模型,而在实际应用中,获取大量标注数据往往是不切实际的。为了解决这一问题,少样本目标检测(FSOD)应运而生。然而,现有的FSOD数据集大多集中在单一的数据域内,而现实世界的应用场景往往涉及跨域的问题。为了填补这一空白,CD-FSOD数据集应运而生。它包含了来自不同数据域的图像数据,为跨域少样本目标检测提供了基准。
解决学术问题
CD-FSOD数据集的提出,主要解决了现有FSOD方法在跨域场景下性能不佳的问题。通过对现有FSOD方法的评估,我们发现,由于源域和目标域之间存在较大的差异,现有的FSOD方法往往无法取得满意的效果,甚至不如简单的微调模型。为了解决这一问题,CD-FSOD数据集引入了一种基于蒸馏的基线方法,通过学生和教师模型的相互强化,有效地缓解了过拟合问题,从而在跨域少样本目标检测任务上取得了显著的性能提升。
实际应用
CD-FSOD数据集在实际应用中具有重要的意义。它可以帮助研究人员更好地理解和解决跨域少样本目标检测问题,从而推动相关技术的发展。此外,CD-FSOD数据集还可以用于训练跨域少样本目标检测模型,为实际应用提供技术支持。例如,在生物识别、水下检测、遥感图像分析等领域,CD-FSOD数据集可以用于训练跨域少样本目标检测模型,从而提高模型的准确性和鲁棒性。
数据集最近研究
最新研究方向
近年来,跨领域小样本目标检测(CD-FSOD)已成为计算机视觉领域的研究热点。本研究提出的CD-FSOD基准数据集,涵盖了三个具有不同相似度的目标数据集:ArTaxOr、UODD和DIOR,用于评估现有FSOD方法的性能。实验结果表明,现有FSOD方法在CD-FSOD基准数据集上的性能并不理想,甚至不如简单的微调模型。为了解决这一问题,本研究引入了一种新的基于蒸馏的基线方法,该方法通过“飞轮效应”使学生模型和教师模型相互促进,从而在训练过程中不断提高。实验结果表明,该方法在CD-FSOD基准数据集上取得了显著的性能提升。因此,CD-FSOD基准数据集的提出为跨领域小样本目标检测研究提供了新的方向和思路,具有重要的理论和实际意义。
相关研究论文
  • 1
    CD-FSOD: A Benchmark for Cross-domain Few-shot Object Detection机器视觉与信号分析中心 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作