Multimodal-Fatima/FGVC_Aircraft_train
收藏Hugging Face2023-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Multimodal-Fatima/FGVC_Aircraft_train
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: family
dtype:
class_label:
names:
'0': A300
'1': A310
'2': A320
'3': A330
'4': A340
'5': A380
'6': ATR-42
'7': ATR-72
'8': An-12
'9': BAE 146
'10': BAE-125
'11': Beechcraft 1900
'12': Boeing 707
'13': Boeing 717
'14': Boeing 727
'15': Boeing 737
'16': Boeing 747
'17': Boeing 757
'18': Boeing 767
'19': Boeing 777
'20': C-130
'21': C-47
'22': CRJ-200
'23': CRJ-700
'24': Cessna 172
'25': Cessna 208
'26': Cessna Citation
'27': Challenger 600
'28': DC-10
'29': DC-3
'30': DC-6
'31': DC-8
'32': DC-9
'33': DH-82
'34': DHC-1
'35': DHC-6
'36': DR-400
'37': Dash 8
'38': Dornier 328
'39': EMB-120
'40': Embraer E-Jet
'41': Embraer ERJ 145
'42': Embraer Legacy 600
'43': Eurofighter Typhoon
'44': F-16
'45': F/A-18
'46': Falcon 2000
'47': Falcon 900
'48': Fokker 100
'49': Fokker 50
'50': Fokker 70
'51': Global Express
'52': Gulfstream
'53': Hawk T1
'54': Il-76
'55': King Air
'56': L-1011
'57': MD-11
'58': MD-80
'59': MD-90
'60': Metroliner
'61': PA-28
'62': SR-20
'63': Saab 2000
'64': Saab 340
'65': Spitfire
'66': Tornado
'67': Tu-134
'68': Tu-154
'69': Yak-42
- name: manufacturer
dtype:
class_label:
names:
'0': ATR
'1': Airbus
'2': Antonov
'3': Beechcraft
'4': Boeing
'5': Bombardier Aerospace
'6': British Aerospace
'7': Canadair
'8': Cessna
'9': Cirrus Aircraft
'10': Dassault Aviation
'11': Dornier
'12': Douglas Aircraft Company
'13': Embraer
'14': Eurofighter
'15': Fairchild
'16': Fokker
'17': Gulfstream Aerospace
'18': Ilyushin
'19': Lockheed Corporation
'20': Lockheed Martin
'21': McDonnell Douglas
'22': Panavia
'23': Piper
'24': Robin
'25': Saab
'26': Supermarine
'27': Tupolev
'28': Yakovlev
'29': de Havilland
- name: label
dtype:
class_label:
names:
'0': 707-320
'1': 727-200
'2': 737-200
'3': 737-300
'4': 737-400
'5': 737-500
'6': 737-600
'7': 737-700
'8': 737-800
'9': 737-900
'10': 747-100
'11': 747-200
'12': 747-300
'13': 747-400
'14': 757-200
'15': 757-300
'16': 767-200
'17': 767-300
'18': 767-400
'19': 777-200
'20': 777-300
'21': A300B4
'22': A310
'23': A318
'24': A319
'25': A320
'26': A321
'27': A330-200
'28': A330-300
'29': A340-200
'30': A340-300
'31': A340-500
'32': A340-600
'33': A380
'34': ATR-42
'35': ATR-72
'36': An-12
'37': BAE 146-200
'38': BAE 146-300
'39': BAE-125
'40': Beechcraft 1900
'41': Boeing 717
'42': C-130
'43': C-47
'44': CRJ-200
'45': CRJ-700
'46': CRJ-900
'47': Cessna 172
'48': Cessna 208
'49': Cessna 525
'50': Cessna 560
'51': Challenger 600
'52': DC-10
'53': DC-3
'54': DC-6
'55': DC-8
'56': DC-9-30
'57': DH-82
'58': DHC-1
'59': DHC-6
'60': DHC-8-100
'61': DHC-8-300
'62': DR-400
'63': Dornier 328
'64': E-170
'65': E-190
'66': E-195
'67': EMB-120
'68': ERJ 135
'69': ERJ 145
'70': Embraer Legacy 600
'71': Eurofighter Typhoon
'72': F-16A/B
'73': F/A-18
'74': Falcon 2000
'75': Falcon 900
'76': Fokker 100
'77': Fokker 50
'78': Fokker 70
'79': Global Express
'80': Gulfstream IV
'81': Gulfstream V
'82': Hawk T1
'83': Il-76
'84': L-1011
'85': MD-11
'86': MD-80
'87': MD-87
'88': MD-90
'89': Metroliner
'90': Model B200
'91': PA-28
'92': SR-20
'93': Saab 2000
'94': Saab 340
'95': Spitfire
'96': Tornado
'97': Tu-134
'98': Tu-154
'99': Yak-42
- name: id
dtype: int64
- name: clip_tags_ViT_L_14
sequence: string
- name: LLM_Description_gpt3_downstream_tasks_ViT_L_14
sequence: string
- name: blip_caption
dtype: string
- name: LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14
sequence: string
- name: Attributes_ViT_L_14_text_davinci_003_full
sequence: string
- name: Attributes_ViT_L_14_text_davinci_003_fgvc
sequence: string
- name: clip_tags_ViT_L_14_with_openai_classes
sequence: string
- name: clip_tags_ViT_L_14_wo_openai_classes
sequence: string
- name: clip_tags_ViT_L_14_simple_specific
dtype: string
- name: clip_tags_ViT_L_14_ensemble_specific
dtype: string
- name: clip_tags_ViT_B_16_simple_specific
dtype: string
- name: clip_tags_ViT_B_16_ensemble_specific
dtype: string
- name: clip_tags_ViT_B_32_simple_specific
dtype: string
- name: clip_tags_ViT_B_32_ensemble_specific
dtype: string
- name: Attributes_ViT_B_16_descriptors_text_davinci_003_full
sequence: string
- name: Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full
sequence: string
- name: clip_tags_LAION_ViT_H_14_2B_simple_specific
dtype: string
- name: clip_tags_LAION_ViT_H_14_2B_ensemble_specific
dtype: string
splits:
- name: train
num_bytes: 931613762.0
num_examples: 3334
download_size: 925638163
dataset_size: 931613762.0
---
# Dataset Card for "FGVC_Aircraft_train"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Multimodal-Fatima
原始信息汇总
数据集概述
数据集 "FGVC_Aircraft_train" 包含以下关键特征:
1. 数据集特征
- image: 数据类型为图像。
- family: 数据类型为分类标签,包含多个飞机家族的名称,如A300, A310, A320等。
- manufacturer: 数据类型为分类标签,包含多个飞机制造商的名称,如ATR, Airbus, Antonov等。
- label: 数据类型为分类标签,包含多个飞机型号的名称,如707-320, 727-200, 737-200等。
- id: 数据类型为int64。
- clip_tags_ViT_L_14: 数据类型为字符串序列。
- LLM_Description_gpt3_downstream_tasks_ViT_L_14: 数据类型为字符串序列。
- blip_caption: 数据类型为字符串。
- LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14: 数据类型为字符串序列。
- Attributes_ViT_L_14_text_davinci_003_full: 数据类型为字符串序列。
- Attributes_ViT_L_14_text_davinci_003_fgvc: 数据类型为字符串序列。
- clip_tags_ViT_L_14_with_openai_classes: 数据类型为字符串序列。
- clip_tags_ViT_L_14_wo_openai_classes: 数据类型为字符串序列。
- clip_tags_ViT_L_14_simple_specific: 数据类型为字符串。
- clip_tags_ViT_L_14_ensemble_specific: 数据类型为字符串。
- clip_tags_ViT_B_16_simple_specific: 数据类型为字符串。
- clip_tags_ViT_B_16_ensemble_specific: 数据类型为字符串。
- clip_tags_ViT_B_32_simple_specific: 数据类型为字符串。
- clip_tags_ViT_B_32_ensemble_specific: 数据类型为字符串。
- Attributes_ViT_B_16_descriptors_text_davinci_003_full: 数据类型为字符串序列。
- Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full: 数据类型为字符串序列。
- clip_tags_LAION_ViT_H_14_2B_simple_specific: 数据类型为字符串。
- clip_tags_LAION_ViT_H_14_2B_ensemble_specific: 数据类型为字符串。
2. 数据集分割
- train: 包含3334个样本,数据集大小为931613762字节,下载大小为925638163字节。
搜集汇总
数据集介绍

构建方式
在细粒度视觉分类领域,FGVC_Aircraft_train数据集的构建体现了对航空器图像的系统性采集与标注。该数据集源自FGVC-Aircraft基准,通过专业渠道收集了涵盖100种不同机型变体的高分辨率图像。构建过程中,每张图像均被精确标注至具体型号层级,并辅以制造商和家族类别信息,确保了分类体系的严谨性与完整性。数据集的整理遵循了标准化的机器学习数据预处理流程,为后续的模型训练提供了结构化的高质量输入。
使用方法
该数据集主要应用于细粒度视觉分类任务的模型训练与评估。研究人员可直接加载图像数据及其对应的机型标签,用于训练深度卷积神经网络或视觉Transformer模型。数据集提供的多层级标签支持从粗到细的分类研究,而丰富的CLIP标签和文本描述则可用于多模态学习、零样本学习或图像描述生成等前沿任务。通过Hugging Face Datasets库,用户可以便捷地访问和流式加载数据,并利用其标准化的接口将其无缝集成到现有的机器学习工作流中。
背景与挑战
背景概述
在细粒度视觉分类领域,精准识别高度相似子类别对象是核心难题。FGVC Aircraft数据集作为该领域的经典基准,由牛津大学视觉几何组于2013年创建,专注于飞机型号的精细识别。该数据集旨在推动模型在细微视觉差异上的判别能力,其构建涵盖了从商用客机到军用机型等多种类别,对计算机视觉在专业领域的应用产生了深远影响,成为评估模型细粒度识别性能的重要标准。
当前挑战
该数据集致力于解决细粒度视觉分类中,因类间差异微小、类内差异显著而导致的识别挑战,例如区分不同制造商生产的相似机型。在构建过程中,挑战主要集中于图像采集的规范性与标注的精确性,需确保每张图像在视角、光照及背景上具有代表性,同时要求标注者具备专业的航空知识,以准确区分复杂的飞机型号及制造商信息,保证数据标签的可靠性。
常用场景
经典使用场景
在细粒度视觉分类领域,FGVC_Aircraft_train数据集作为航空器识别的基准资源,其经典应用场景聚焦于模型对飞机型号的精确区分。该数据集通过提供涵盖多种制造商与系列的高分辨率图像,支持研究者构建能够辨别细微视觉差异的分类系统,例如区分波音737系列的不同子型号或空客A320家族的具体变体。这一过程不仅考验模型的特征提取能力,更推动了细粒度识别技术在复杂现实场景中的深化发展。
解决学术问题
该数据集有效应对了细粒度视觉分类中的核心挑战,即如何在高度相似的类别间实现精准判别。它通过提供结构化的飞机型号、家族与制造商标签,为学术研究解决了类别间差异细微、类内方差显著等难题。其意义在于建立了航空器识别的标准化评估框架,促进了深度学习模型在特征学习、注意力机制及跨域泛化等方面的理论探索,对提升计算机视觉系统的判别精度与鲁棒性产生了深远影响。
实际应用
在实际应用层面,FGVC_Aircraft_train数据集支撑了航空监控、机场管理及航空摄影分析等多个现实场景。基于该数据集训练的模型可部署于机场跑道监视系统,实现飞机型号的自动识别与流量统计;在航空安全领域,有助于快速辨识异常或特定机型;同时,也为航空爱好者及专业媒体提供了自动标注与分类工具,提升了航空图像资料管理的效率与准确性。
数据集最近研究
最新研究方向
在细粒度视觉分类领域,FGVC_Aircraft数据集作为航空器识别的基准,其最新研究聚焦于多模态融合与视觉语言模型的协同应用。通过集成CLIP、BLIP等预训练视觉语言模型生成的丰富语义标签与描述,研究者致力于探索跨模态特征对齐与知识蒸馏技术,以提升模型在复杂背景下的细粒度识别精度。这一方向与当前通用人工智能的热点事件紧密相连,推动了零样本学习与开放词汇识别在专业垂直领域的发展,为航空安全监控与智能交通管理提供了更为精准的技术支撑,具有显著的学术价值与应用潜力。
以上内容由遇见数据集搜集并总结生成



