MoFSOD

Name: MoFSOD
Creator: AWS AI Labs
Published: 2022-07-23 00:13:22
License: 暂无描述

arXiv2022-07-23 更新2024-07-31 收录

下载链接：

https://github.com/amazon-research/few-shot-object-detection-benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

MoFSOD是一个包含10个不同领域数据集的基准，用于评估少样本目标检测算法。该基准旨在模拟多样化的实际应用场景，涵盖了航空图像、农业、野生动物、卡通、时尚、食品、标志、人群、安全和交通等多个领域的数据集。通过这个基准，研究者可以评估和比较不同算法在跨领域少样本学习任务中的表现，从而推动少样本目标检测技术的发展。

MoFSOD is a benchmark consisting of 10 cross-domain datasets for evaluating few-shot object detection algorithms. This benchmark aims to simulate diverse real-world application scenarios, covering datasets from domains including aerial imagery, agriculture, wildlife, cartoons, fashion, food, logos, crowds, security, and transportation. With this benchmark, researchers can evaluate and compare the performance of different algorithms on cross-domain few-shot learning tasks, thereby advancing the development of few-shot object detection technologies.

提供机构：

AWS AI Labs

创建时间：

2022-07-23

原始信息汇总

数据集概述

数据集准备

数据集数量：10个数据集
准备步骤：
- 参考datasets文件夹下的readme文件进行设置。
- 下载并设置JPEGImages文件夹。
- 提取并写入datasets文件夹，使用提供的转换后的OpenImages风格注释。

少样本采样

采样脚本：提供了一个带有固定随机种子的脚本。
采样步骤：
- 设置好datasets文件夹后，运行python generate_oi_annotations.py创建少样本采样数据集。
- 提供论文中使用的精确采样。

数据集使用

数据集读取：提供了一个OpenImages数据集读取器，可在Detectron2中注册数据集。
注册方法： python from common.openimages_dataset import openimages dataset = openimages(data_dir=./datasets/, dataset_name=deepfruits, post_fix_key=str(fold))

搜集汇总

数据集介绍

构建方式

在少样本目标检测领域，传统基准数据集往往局限于单一或相似领域，难以全面评估算法在真实跨域场景下的泛化能力。MoFSOD基准的构建旨在突破这一局限，通过精心遴选来自十个不同领域的公开数据集，涵盖航空影像、农业、野生动物、卡通、时尚、食品、商标、人群、安防和交通等多个维度。每个领域的数据集均保留了原始标注体系与图像分布特性，采用自然K样本采样算法构建少样本训练集，该算法通过随机抽取C×K幅图像并确保每个类别至少包含一幅样本，从而维持数据集中固有的类别不平衡性，更贴近实际应用场景。

特点

MoFSOD基准的显著特征在于其卓越的领域多样性与评估深度。它集成了VisDrone、DeepFruits、iWildCam等十个异构数据集，在图像风格、目标尺度、类别数量及标注密度上均呈现广泛差异，例如类别数从1到352不等，每幅图像标注框数量介于1.2至54.4之间。这种多样性通过计算各数据集与COCO的领域距离得以量化，其值分布在0.1至0.8的广阔区间，确保了基准能够全面检验模型从自然图像到特殊领域的迁移能力。此外，基准引入了基于AP50与平均排名的评估协议，通过多轮随机采样减少方差，提供了稳定可靠的性能度量。

使用方法

使用MoFSOD基准进行少样本目标检测评估遵循一套系统化的实验流程。研究人员首先需在大规模自然图像数据集（如COCO、LVIS）上预训练目标检测模型，随后在MoFSOD的各个领域数据集上，依据指定的平均样本数K（如1、3、5、10），采用自然K样本采样算法构建少样本训练集。模型在此训练集上进行微调，训练迭代次数固定为2000次，并需在预设的学习率范围内进行超参数搜索以获取最佳性能。最终，在从原始测试集中随机抽取的1000幅图像上评估模型性能，计算平均精度AP50，并综合多次随机采样的结果报告均值与标准差，以确保结论的统计稳健性。

背景与挑战

背景概述

MoFSOD（Multi-dOmain Few-Shot Object Detection）基准数据集由AWS AI Labs与延世大学的研究团队于2022年联合创建，旨在重新审视少样本目标检测任务在跨域场景下的性能评估。该数据集整合了来自10个不同领域的公开数据集，涵盖航空影像、农业、野生动物、卡通、时尚、食品、商标、人群、安防与交通等多个应用场景，构建了一个具有高度多样性的多域少样本目标检测评估平台。其核心研究问题聚焦于探索在预训练与少样本学习域存在显著差异时，现有FSOD算法的泛化能力与适应性，挑战了传统同域评估范式的局限性，为少样本目标检测研究提供了更贴近实际应用的评估框架，对推动跨域迁移学习与少样本视觉理解的发展具有重要影响力。

当前挑战

MoFSOD数据集所解决的领域问题是多域少样本目标检测，其核心挑战在于如何设计能够在域间差异显著时仍保持高效泛化能力的检测算法。传统FSOD方法在同域设定下依赖参数冻结以防止过拟合，但在跨域场景中，过度冻结会限制模型对新域特征的适应，导致性能下降。此外，数据集的构建过程面临多重挑战：一是需从海量公开数据中筛选出代表性强、标注质量高且域分布多样的子集，确保评估的全面性与可靠性；二是设计自然K样本采样策略以维持原始数据中的类别不平衡分布，避免人为平衡采样引入的偏差；三是统一不同数据集的评估协议与度量标准，保证跨域比较的公平性与一致性。这些挑战共同推动了FSOD领域向更实际、更复杂的应用场景演进。

常用场景

经典使用场景

在少样本目标检测领域，MoFSOD数据集作为多领域基准，其经典使用场景在于评估算法在跨域环境下的泛化能力。该数据集整合了来自航空影像、农业、野生动物、卡通、时尚、食品、商标、人群、安防和交通等十个不同领域的图像，通过自然K-shot采样策略模拟真实世界中类别分布不均衡的情况。研究者通常利用MoFSOD来测试少样本检测模型在预训练与少样本学习域存在显著差异时的性能，从而推动算法在多样化实际任务中的适应性。

实际应用

在实际应用层面，MoFSOD数据集反映了少样本目标检测技术在现实场景中的广泛需求。例如，在安防领域，可用于X光图像中违禁物品的快速检测；在农业中，协助识别新型果实或病虫害；在商标检测中，帮助品牌监控仅凭少量样本即可定位新标识。数据集的多样性能有效支持模型在数据稀缺或标注成本高昂的领域（如野生动物监测或医疗影像分析）中的部署，提升自动化系统的灵活性与经济性。

衍生相关工作

基于MoFSOD数据集，研究者衍生出一系列经典工作，进一步推动了少样本检测领域的发展。例如，论文中提出的FSCE+方法通过简化全连接检测头并微调更多参数，显著提升了对比提议编码的性能；LVIS+则利用CLIP文本嵌入初始化分类器，将大规模语言-视觉预训练知识迁移至少样本任务。这些工作不仅在该基准上达到了先进水平，还启发了后续研究，如探索基于域自适应的智能参数调整策略，或结合Transformer架构设计专用于少样本检测的模型，从而在多领域应用中实现更优的泛化与效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集