Few-Shot Object Detection Dataset

github2024-05-23 更新2024-05-31 收录

下载链接：

https://github.com/fanq15/Few-Shot-Object-Detection-Dataset

下载链接

链接失效反馈

资源简介：

Few-Shot Object Detection Dataset（FSOD）是一个专为少样本目标检测设计的高多样性数据集，旨在评估模型在新类别上的泛化能力。该数据集通过总结ImageNet和OpenImage的标签系统，合并相同语义的类别，并移除质量不佳的图像和标注，构建了一个包含1000个类别的训练和测试集，其中531个类别来自ImageNet，469个来自Open Image。

The Few-Shot Object Detection Dataset (FSOD) is a highly diverse dataset specifically designed for few-shot object detection, aimed at evaluating the generalization capabilities of models on new categories. By summarizing the label systems of ImageNet and OpenImage, merging categories with the same semantics, and removing low-quality images and annotations, this dataset constructs a training and testing set comprising 1000 categories, with 531 categories sourced from ImageNet and 469 from Open Image.

创建时间：

2019-08-02

原始信息汇总

数据集概述

数据集名称

Few-Shot Object Detection Dataset (FSOD)

数据集目的

FSOD是一个专为少样本目标检测设计的高多样性数据集，旨在评估模型在新类别上的泛化能力。

数据集构建

标签系统：从ImageNet和OpenImage中总结出标签系统，合并语义相同的类别，移除不符合要求的图像和标注框。
数据分割：遵循少样本学习原则，将数据分为训练集和测试集，确保类别不重叠。训练集包含MS COCO和ImageNet的类别，测试集包含200个与训练集类别距离最大的类别。
类别数量：总共有1000个类别，其中800个用于训练，200个用于测试。

数据集格式

FSOD数据集采用MS COCO格式，包含图像和标注文件。

数据集下载

可通过Google Driver或Baidu Driver (密码: wnj8) 下载。

数据集统计

	训练集	测试集
类别数	800	200
图像数	52350	14152
标注框数	147489	35102
平均每图像标注框数	2.82	2.48
最小每类别图像数	22	30
最大每类别图像数	208	199
平均每类别图像数	75.65	74.31
标注框尺寸范围	[6, 6828]	[13, 4605]
标注框面积比	[0.0009, 1]	[0.0009, 1]
标注框宽高比	[0.0216, 89]	[0.0199, 51.5]

维护者

Qi Fan (HKUST, fanqithu@gmail.com)
Wei Zhuo (Tencent, wei.zhuowx@gmail.com)
Yu-Wing Tai (Tencent, yuwingtai@tencent.com)

引用信息

若在研究中使用此数据集，请引用以下论文：

@inproceedings{fan2020fsod, title={Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector}, author={Fan, Qi and Zhuo, Wei and Tang, Chi-Keung and Tai, Yu-Wing}, booktitle={CVPR}, year={2020} }

AI搜集汇总

数据集介绍

构建方式

为了构建Few-Shot Object Detection Dataset (FSOD)，研究者首先从ImageNet和OpenImage中总结出一个标签系统。通过合并原始标签树中的叶标签，将具有相同语义的类别（如冰熊和北极熊）归并为一个类别，并剔除不属于任何叶类别的语义。随后，移除标签质量不佳的图像以及边界框尺寸不当的图像，特别是那些小于图像尺寸0.05%的边界框，因其视觉质量较差且不适合作为支持样本。遵循少样本学习原则，数据被划分为训练集和测试集，确保类别无重叠。训练集包含MS COCO和ImageNet数据集中的类别，以支持预训练需求。测试集则包含200个类别，这些类别与训练集中的类别在is-a分类法中具有最大距离。最终，构建了一个包含1000个类别的数据集，其中531个类别来自ImageNet，469个来自Open Image，清晰区分了训练和测试类别。

特点

Few-Shot Object Detection Dataset (FSOD) 的特点在于其高度多样性和专门为少样本目标检测设计的结构。该数据集通过严格的标签系统和图像筛选，确保了数据的高质量。训练集和测试集的类别无重叠，有效评估模型在新类别上的泛化能力。此外，数据集的格式与MS COCO兼容，便于研究人员直接使用现有工具和方法进行分析。数据集的类别分布均衡，训练集和测试集的图像数量和边界框数量均经过精心设计，以支持少样本学习任务的需求。

使用方法

使用Few-Shot Object Detection Dataset (FSOD) 时，首先需下载图像和标注文件，可通过Google Drive或Baidu Drive获取。数据集采用MS COCO格式，因此可直接放置在COCO数据集的位置，并使用类似COCO数据集的方式进行处理。数据集的目录结构应按照指定格式组织，确保代码能够正确识别和加载数据。具体而言，将FSOD数据集放置在datasets目录下，包含annotations和images两个子目录，分别存放标注文件和图像文件。通过这种方式，研究人员可以利用现有工具和框架，如Detectron2，直接进行少样本目标检测任务的训练和评估。

背景与挑战

背景概述

Few-Shot Object Detection Dataset (FSOD) 是由香港科技大学（HKUST）的Qi Fan、Tencent的Wei Zhuo和Yu-Wing Tai共同创建的一个高度多样化的数据集，专门设计用于少样本目标检测，旨在评估模型在新类别上的泛化能力。该数据集的构建始于2020年，通过整合ImageNet和OpenImage的标签系统，剔除低质量标签和不适宜的边界框，最终形成了包含1000个类别的数据集，其中训练集包含800个类别，测试集包含200个类别。FSOD的创建不仅解决了少样本学习中的关键问题，还为研究人员提供了一个标准化的评估平台，推动了目标检测领域的发展。

当前挑战

FSOD数据集在构建过程中面临了多重挑战。首先，整合来自ImageNet和OpenImage的标签系统需要精确的语义分析和类别合并，以确保数据的一致性和质量。其次，剔除低质量图像和不适宜的边界框增加了数据处理的复杂性。此外，为了遵循少样本学习原则，训练集和测试集的类别必须严格无重叠，这要求在类别选择和数据分割上进行精细的操作。最后，将数据集转换为MS COCO格式以方便使用，也涉及大量的技术调试和优化。这些挑战共同构成了FSOD数据集构建过程中的主要难点。

常用场景

经典使用场景

Few-Shot Object Detection Dataset（FSOD）在少样本目标检测领域中具有经典应用场景。该数据集通过精心设计的类别分割，使得训练集和测试集的类别无重叠，从而有效评估模型在新类别上的泛化能力。研究人员常利用FSOD进行模型预训练，随后在测试集上验证其少样本检测性能，特别是在数据受限的情况下，如10-shot任务中，FSOD能够显著提升模型的检测精度，达到12.0 AP。

解决学术问题

FSOD数据集解决了少样本学习中的关键学术问题，即如何在极少标注数据的情况下实现高效的目标检测。通过精心设计的类别分割和高质量的数据筛选，FSOD确保了训练和测试集的类别独立性，从而有效评估模型的泛化能力。这一数据集的引入，推动了少样本学习领域的研究进展，为解决实际应用中的数据稀缺问题提供了有力支持。

衍生相关工作

基于FSOD数据集，研究者们开展了一系列相关工作，推动了少样本目标检测领域的发展。例如，Fan等人提出的Attention-RPN和Multi-Relation Detector模型，通过结合注意力机制和多关系检测器，显著提升了少样本检测的性能。此外，FewX工具箱的发布，进一步简化了FSOD数据集的使用，使得更多研究者能够便捷地进行少样本检测实验，促进了该领域的技术进步和应用拓展。

以上内容由AI搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集