five

Multimodal-Fatima/FGVC_Aircraft_train

收藏
Hugging Face2023-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Multimodal-Fatima/FGVC_Aircraft_train
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: family dtype: class_label: names: '0': A300 '1': A310 '2': A320 '3': A330 '4': A340 '5': A380 '6': ATR-42 '7': ATR-72 '8': An-12 '9': BAE 146 '10': BAE-125 '11': Beechcraft 1900 '12': Boeing 707 '13': Boeing 717 '14': Boeing 727 '15': Boeing 737 '16': Boeing 747 '17': Boeing 757 '18': Boeing 767 '19': Boeing 777 '20': C-130 '21': C-47 '22': CRJ-200 '23': CRJ-700 '24': Cessna 172 '25': Cessna 208 '26': Cessna Citation '27': Challenger 600 '28': DC-10 '29': DC-3 '30': DC-6 '31': DC-8 '32': DC-9 '33': DH-82 '34': DHC-1 '35': DHC-6 '36': DR-400 '37': Dash 8 '38': Dornier 328 '39': EMB-120 '40': Embraer E-Jet '41': Embraer ERJ 145 '42': Embraer Legacy 600 '43': Eurofighter Typhoon '44': F-16 '45': F/A-18 '46': Falcon 2000 '47': Falcon 900 '48': Fokker 100 '49': Fokker 50 '50': Fokker 70 '51': Global Express '52': Gulfstream '53': Hawk T1 '54': Il-76 '55': King Air '56': L-1011 '57': MD-11 '58': MD-80 '59': MD-90 '60': Metroliner '61': PA-28 '62': SR-20 '63': Saab 2000 '64': Saab 340 '65': Spitfire '66': Tornado '67': Tu-134 '68': Tu-154 '69': Yak-42 - name: manufacturer dtype: class_label: names: '0': ATR '1': Airbus '2': Antonov '3': Beechcraft '4': Boeing '5': Bombardier Aerospace '6': British Aerospace '7': Canadair '8': Cessna '9': Cirrus Aircraft '10': Dassault Aviation '11': Dornier '12': Douglas Aircraft Company '13': Embraer '14': Eurofighter '15': Fairchild '16': Fokker '17': Gulfstream Aerospace '18': Ilyushin '19': Lockheed Corporation '20': Lockheed Martin '21': McDonnell Douglas '22': Panavia '23': Piper '24': Robin '25': Saab '26': Supermarine '27': Tupolev '28': Yakovlev '29': de Havilland - name: label dtype: class_label: names: '0': 707-320 '1': 727-200 '2': 737-200 '3': 737-300 '4': 737-400 '5': 737-500 '6': 737-600 '7': 737-700 '8': 737-800 '9': 737-900 '10': 747-100 '11': 747-200 '12': 747-300 '13': 747-400 '14': 757-200 '15': 757-300 '16': 767-200 '17': 767-300 '18': 767-400 '19': 777-200 '20': 777-300 '21': A300B4 '22': A310 '23': A318 '24': A319 '25': A320 '26': A321 '27': A330-200 '28': A330-300 '29': A340-200 '30': A340-300 '31': A340-500 '32': A340-600 '33': A380 '34': ATR-42 '35': ATR-72 '36': An-12 '37': BAE 146-200 '38': BAE 146-300 '39': BAE-125 '40': Beechcraft 1900 '41': Boeing 717 '42': C-130 '43': C-47 '44': CRJ-200 '45': CRJ-700 '46': CRJ-900 '47': Cessna 172 '48': Cessna 208 '49': Cessna 525 '50': Cessna 560 '51': Challenger 600 '52': DC-10 '53': DC-3 '54': DC-6 '55': DC-8 '56': DC-9-30 '57': DH-82 '58': DHC-1 '59': DHC-6 '60': DHC-8-100 '61': DHC-8-300 '62': DR-400 '63': Dornier 328 '64': E-170 '65': E-190 '66': E-195 '67': EMB-120 '68': ERJ 135 '69': ERJ 145 '70': Embraer Legacy 600 '71': Eurofighter Typhoon '72': F-16A/B '73': F/A-18 '74': Falcon 2000 '75': Falcon 900 '76': Fokker 100 '77': Fokker 50 '78': Fokker 70 '79': Global Express '80': Gulfstream IV '81': Gulfstream V '82': Hawk T1 '83': Il-76 '84': L-1011 '85': MD-11 '86': MD-80 '87': MD-87 '88': MD-90 '89': Metroliner '90': Model B200 '91': PA-28 '92': SR-20 '93': Saab 2000 '94': Saab 340 '95': Spitfire '96': Tornado '97': Tu-134 '98': Tu-154 '99': Yak-42 - name: id dtype: int64 - name: clip_tags_ViT_L_14 sequence: string - name: LLM_Description_gpt3_downstream_tasks_ViT_L_14 sequence: string - name: blip_caption dtype: string - name: LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14 sequence: string - name: Attributes_ViT_L_14_text_davinci_003_full sequence: string - name: Attributes_ViT_L_14_text_davinci_003_fgvc sequence: string - name: clip_tags_ViT_L_14_with_openai_classes sequence: string - name: clip_tags_ViT_L_14_wo_openai_classes sequence: string - name: clip_tags_ViT_L_14_simple_specific dtype: string - name: clip_tags_ViT_L_14_ensemble_specific dtype: string - name: clip_tags_ViT_B_16_simple_specific dtype: string - name: clip_tags_ViT_B_16_ensemble_specific dtype: string - name: clip_tags_ViT_B_32_simple_specific dtype: string - name: clip_tags_ViT_B_32_ensemble_specific dtype: string - name: Attributes_ViT_B_16_descriptors_text_davinci_003_full sequence: string - name: Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full sequence: string - name: clip_tags_LAION_ViT_H_14_2B_simple_specific dtype: string - name: clip_tags_LAION_ViT_H_14_2B_ensemble_specific dtype: string splits: - name: train num_bytes: 931613762.0 num_examples: 3334 download_size: 925638163 dataset_size: 931613762.0 --- # Dataset Card for "FGVC_Aircraft_train" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Multimodal-Fatima
原始信息汇总

数据集概述

数据集 "FGVC_Aircraft_train" 包含以下关键特征:

1. 数据集特征

  • image: 数据类型为图像。
  • family: 数据类型为分类标签,包含多个飞机家族的名称,如A300, A310, A320等。
  • manufacturer: 数据类型为分类标签,包含多个飞机制造商的名称,如ATR, Airbus, Antonov等。
  • label: 数据类型为分类标签,包含多个飞机型号的名称,如707-320, 727-200, 737-200等。
  • id: 数据类型为int64。
  • clip_tags_ViT_L_14: 数据类型为字符串序列。
  • LLM_Description_gpt3_downstream_tasks_ViT_L_14: 数据类型为字符串序列。
  • blip_caption: 数据类型为字符串。
  • LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14: 数据类型为字符串序列。
  • Attributes_ViT_L_14_text_davinci_003_full: 数据类型为字符串序列。
  • Attributes_ViT_L_14_text_davinci_003_fgvc: 数据类型为字符串序列。
  • clip_tags_ViT_L_14_with_openai_classes: 数据类型为字符串序列。
  • clip_tags_ViT_L_14_wo_openai_classes: 数据类型为字符串序列。
  • clip_tags_ViT_L_14_simple_specific: 数据类型为字符串。
  • clip_tags_ViT_L_14_ensemble_specific: 数据类型为字符串。
  • clip_tags_ViT_B_16_simple_specific: 数据类型为字符串。
  • clip_tags_ViT_B_16_ensemble_specific: 数据类型为字符串。
  • clip_tags_ViT_B_32_simple_specific: 数据类型为字符串。
  • clip_tags_ViT_B_32_ensemble_specific: 数据类型为字符串。
  • Attributes_ViT_B_16_descriptors_text_davinci_003_full: 数据类型为字符串序列。
  • Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full: 数据类型为字符串序列。
  • clip_tags_LAION_ViT_H_14_2B_simple_specific: 数据类型为字符串。
  • clip_tags_LAION_ViT_H_14_2B_ensemble_specific: 数据类型为字符串。

2. 数据集分割

  • train: 包含3334个样本,数据集大小为931613762字节,下载大小为925638163字节。
搜集汇总
数据集介绍
main_image_url
构建方式
在细粒度视觉分类领域,FGVC_Aircraft_train数据集的构建体现了对航空器图像的系统性采集与标注。该数据集源自FGVC-Aircraft基准,通过专业渠道收集了涵盖100种不同机型变体的高分辨率图像。构建过程中,每张图像均被精确标注至具体型号层级,并辅以制造商和家族类别信息,确保了分类体系的严谨性与完整性。数据集的整理遵循了标准化的机器学习数据预处理流程,为后续的模型训练提供了结构化的高质量输入。
使用方法
该数据集主要应用于细粒度视觉分类任务的模型训练与评估。研究人员可直接加载图像数据及其对应的机型标签,用于训练深度卷积神经网络或视觉Transformer模型。数据集提供的多层级标签支持从粗到细的分类研究,而丰富的CLIP标签和文本描述则可用于多模态学习、零样本学习或图像描述生成等前沿任务。通过Hugging Face Datasets库,用户可以便捷地访问和流式加载数据,并利用其标准化的接口将其无缝集成到现有的机器学习工作流中。
背景与挑战
背景概述
在细粒度视觉分类领域,精准识别高度相似子类别对象是核心难题。FGVC Aircraft数据集作为该领域的经典基准,由牛津大学视觉几何组于2013年创建,专注于飞机型号的精细识别。该数据集旨在推动模型在细微视觉差异上的判别能力,其构建涵盖了从商用客机到军用机型等多种类别,对计算机视觉在专业领域的应用产生了深远影响,成为评估模型细粒度识别性能的重要标准。
当前挑战
该数据集致力于解决细粒度视觉分类中,因类间差异微小、类内差异显著而导致的识别挑战,例如区分不同制造商生产的相似机型。在构建过程中,挑战主要集中于图像采集的规范性与标注的精确性,需确保每张图像在视角、光照及背景上具有代表性,同时要求标注者具备专业的航空知识,以准确区分复杂的飞机型号及制造商信息,保证数据标签的可靠性。
常用场景
经典使用场景
在细粒度视觉分类领域,FGVC_Aircraft_train数据集作为航空器识别的基准资源,其经典应用场景聚焦于模型对飞机型号的精确区分。该数据集通过提供涵盖多种制造商与系列的高分辨率图像,支持研究者构建能够辨别细微视觉差异的分类系统,例如区分波音737系列的不同子型号或空客A320家族的具体变体。这一过程不仅考验模型的特征提取能力,更推动了细粒度识别技术在复杂现实场景中的深化发展。
解决学术问题
该数据集有效应对了细粒度视觉分类中的核心挑战,即如何在高度相似的类别间实现精准判别。它通过提供结构化的飞机型号、家族与制造商标签,为学术研究解决了类别间差异细微、类内方差显著等难题。其意义在于建立了航空器识别的标准化评估框架,促进了深度学习模型在特征学习、注意力机制及跨域泛化等方面的理论探索,对提升计算机视觉系统的判别精度与鲁棒性产生了深远影响。
实际应用
在实际应用层面,FGVC_Aircraft_train数据集支撑了航空监控、机场管理及航空摄影分析等多个现实场景。基于该数据集训练的模型可部署于机场跑道监视系统,实现飞机型号的自动识别与流量统计;在航空安全领域,有助于快速辨识异常或特定机型;同时,也为航空爱好者及专业媒体提供了自动标注与分类工具,提升了航空图像资料管理的效率与准确性。
数据集最近研究
最新研究方向
在细粒度视觉分类领域,FGVC_Aircraft数据集作为航空器识别的基准,其最新研究聚焦于多模态融合与视觉语言模型的协同应用。通过集成CLIP、BLIP等预训练视觉语言模型生成的丰富语义标签与描述,研究者致力于探索跨模态特征对齐与知识蒸馏技术,以提升模型在复杂背景下的细粒度识别精度。这一方向与当前通用人工智能的热点事件紧密相连,推动了零样本学习与开放词汇识别在专业垂直领域的发展,为航空安全监控与智能交通管理提供了更为精准的技术支撑,具有显著的学术价值与应用潜力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作