Voxel51/FGVC-Aircraft
收藏Hugging Face2024-07-01 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/Voxel51/FGVC-Aircraft
下载链接
链接失效反馈官方服务:
资源简介:
FGVC-Aircraft数据集是一个用于飞机细粒度视觉分类的基准数据集,包含10,200张飞机图像,每张图像中的主要飞机都标注了紧密的边界框和分层次的飞机型号标签。数据集分为训练、验证和测试三个子集,每个子集大小相等。数据集的创建始于2012年约翰霍普金斯大学的CLSP夏季研讨会,由多位研究人员共同完成。数据集的使用仅限于非商业研究目的,原始作者保留版权。
The FGVC-Aircraft dataset is a benchmark dataset for fine-grained visual classification of aircraft, containing 10,200 images of aircraft. Each image is annotated with a tight bounding box and a hierarchical aircraft model label. The dataset is divided into three equally-sized subsets for training, validation, and testing. The creation of this dataset started during the Johns Hopkins CLSP Summer Workshop in 2012, involving multiple researchers. The dataset is intended exclusively for non-commercial research purposes, and the original authors retain the copyright.
提供机构:
Voxel51
原始信息汇总
FGVC-Aircraft 数据集概述
数据集描述
FGVC-Aircraft 是一个用于细粒度视觉分类的飞机数据集。该数据集包含 10,200 张飞机图像,每种飞机型号有 100 张图像,共计 102 种不同的飞机型号变体。每张图像中的主要飞机都带有紧密的边界框和层次化的飞机型号标签。
数据集结构
层次结构
飞机型号按以下四个层次组织:
- 型号(Model):例如 Boeing 737-76J。由于某些型号在视觉上几乎无法区分,此级别不用于评估。
- 变体(Variant):例如 Boeing 737-700。变体将所有视觉上无法区分的型号合并为一个类别。数据集包含 102 种不同的变体。
- 系列(Family):例如 Boeing 737。数据集包含 70 种不同的系列。
- 制造商(Manufacturer):例如 Boeing。数据集包含 41 种不同的制造商。
数据划分
数据集分为三个等大小的训练集、验证集和测试集。前两个集可用于开发,最后一个集应仅用于最终评估。
数据集创建
该数据集的创建始于 2012 年约翰斯·霍普金斯大学 CLSP 夏季研讨会,参与者包括 Matthew B. Blaschko、Ross B. Girshick 等。数据集的创建得到了国家科学基金会、国家情报总监办公室和谷歌公司的支持。
版权与使用限制
图像由多位飞机摄影师慷慨提供,仅用于非商业研究目的。原始作者保留相应照片的版权,未经许可不得用于其他用途。
引用
bibtex @techreport{maji13fine-grained, title = {Fine-Grained Visual Classification of Aircraft}, author = {S. Maji and J. Kannala and E. Rahtu and M. Blaschko and A. Vedaldi}, year = {2013}, archivePrefix = {arXiv}, eprint = {1306.5151}, primaryClass = "cs-cv", }
搜集汇总
数据集介绍

构建方式
FGVC-Aircraft数据集由Johns Hopkins CLSP Summer Workshop 2012发起构建,包含102个不同飞机变体的10000张图像。每张图像均通过紧 bounding box 和层次化飞机模型标签进行标注。数据集按照飞机模型、变种、家族和制造商四个层次进行组织,并划分为三个等大的训练、验证和测试子集,以供开发及最终评估使用。
特点
该数据集的特点在于其精细的视觉分类,专注于飞机模型的不同层次,包括制造商、家族、变体和具体模型。数据集的构建充分考虑了图像的版权问题,所有图像均由摄影师提供,并仅用于非商业研究目的。此外,数据集的测试标签在ImageNet FGVC挑战中直至比赛结束才公开,保证了评估的公正性。
使用方法
使用该数据集前,需先安装FiftyOne库。通过fiftyone.utils.huggingface模块中的load_from_hub函数,可以轻松加载FGVC-Aircraft数据集。加载后,可以利用FiftyOne的应用程序界面进行数据探索和模型训练。数据集的使用需遵守版权规定,仅限于非商业研究目的。
背景与挑战
背景概述
FGVC-Aircraft数据集,全称为Fine-Grained Visual Classification of Aircraft,是一个针对细粒度视觉分类的基准数据集,专注于飞机的类别识别。该数据集于2013年由约翰霍普金斯大学的CLSP夏季研讨会启动,旨在深入理解自然图像中的物体和场景。该数据集包含了10,200张飞机图像,涵盖了102种不同的飞机型号变种,按制造商、家族、型号和变种四个层次进行组织。数据集的创建得到了多家机构和摄影师的非商业研究支持,对细粒度图像分类领域产生了显著影响。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:1) 飞机型号的细粒度分类本身具有难度,需要精确的标注和有效的特征提取;2) 数据集的多样性和规模要求高,以确保模型具有良好的泛化能力;3) 数据集的版权问题,由于图片由不同的摄影师提供,版权归属复杂,仅限于非商业研究使用。在研究领域问题方面,细粒度分类的挑战在于如何精确地区分视觉上极为相似的不同飞机型号,这对算法的准确性和鲁棒性提出了较高要求。
常用场景
经典使用场景
在细粒度视觉分类领域,FGVC-Aircraft数据集的经典使用场景是作为飞机模型识别的基准测试。该数据集通过提供不同角度、不同光照条件下飞机的图片,使得研究者能够训练和评估其图像识别算法在复杂场景下的表现,从而推动算法的精确度和鲁棒性提升。
实际应用
在实际应用中,FGVC-Aircraft数据集可用于航空领域中的自动识别飞机模型,如机场安全管理、航班监控等。此外,它也可用于教育和培训,帮助相关人员识别和了解不同型号的飞机。
衍生相关工作
基于FGVC-Aircraft数据集,研究者们衍生出了一系列相关工作,包括但不限于改进的飞机识别算法、细粒度分类的新方法,以及针对特定应用场景的定制化解决方案,这些工作进一步推动了计算机视觉技术的发展和应用。
以上内容由遇见数据集搜集并总结生成



