dpdl-benchmark/fgvc_aircraft
收藏Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/dpdl-benchmark/fgvc_aircraft
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从HuggingFaceM4/FGVC-Aircraft转换为Parquet格式的,包含10,200张飞机图像,每种102种不同飞机型号变体有100张图像,主要是飞机。使用前需要移除图像底部的20px横幅。数据集包括图像、bbox(边界框坐标)、家族、制造商和型号等特征,每个特征都有详细的类别标签。数据集分为训练集、验证集和测试集,并提供了具体的大小和示例数量。
该数据集是从HuggingFaceM4/FGVC-Aircraft转换为Parquet格式的,包含10,200张飞机图像,每种102种不同飞机型号变体有100张图像,主要是飞机。使用前需要移除图像底部的20px横幅。数据集包括图像、bbox(边界框坐标)、家族、制造商和型号等特征,每个特征都有详细的类别标签。数据集分为训练集、验证集和测试集,并提供了具体的大小和示例数量。
提供机构:
dpdl-benchmark
原始信息汇总
数据集概述
数据集描述
- 格式:该数据集从"HuggingFaceM4/FGVC-Aircraft"转换为Parquet格式。
- 内容:包含10,200张飞机图像,每种102个不同飞机型号变体各有100张图像,大多数为飞机。
- 注意事项:使用前需移除图像底部的20px横幅。
数据集特征
-
图像:
- 名称:image
- 数据类型:image
-
边界框:
- 名称:bbox
- 结构:
- ymin: int64
- xmin: int64
- ymax: int64
- xmax: int64
-
飞机家族:
- 名称:family
- 数据类型:class_label
- 名称列表:包括A300, A310, A320等102种飞机型号。
-
制造商:
- 名称:manufacturer
- 数据类型:class_label
- 名称列表:包括ATR, Airbus, Antonov等30家制造商。
-
型号变体:
- 名称:variant
- 数据类型:class_label
- 名称列表:包括707-320, 727-200, 737-200等102种型号变体。
数据集划分
-
训练集:
- 示例数量:3334
- 数据大小:879,465,161.444字节
-
验证集:
- 示例数量:3333
- 数据大小:866,544,443.931字节
-
测试集:
- 示例数量:3333
- 数据大小:874,244,310.534字节
数据集大小
- 下载大小:2,761,722,129字节
- 数据集大小:2,620,253,915.909字节
搜集汇总
数据集介绍

构建方式
该数据集dpdl-benchmark/fgvc_aircraft由原始的FGVC-Aircraft数据集转换而来,其构建方式是将图片转换为Parquet格式,并针对每种飞机模型变体收集了100张图片,共计10,200张图片,涵盖了102种不同的飞机模型变体。数据集进一步提供了图像的边界框坐标,以及每种飞机的家族、制造商和具体型号等信息,为细粒度视觉分类任务提供了丰富的标注数据。
使用方法
使用该数据集时,用户可以根据自己的需求选择训练集、验证集或测试集。数据集以Parquet格式存储,可以直接加载到支持该格式的数据处理框架中。用户需在使用前对图片进行预处理,移除底部的横幅。数据集可通过HuggingFace提供的接口进行下载和加载,支持多种编程语言,便于集成到不同的应用和研究中。
背景与挑战
背景概述
FGVC-Aircraft数据集,由Maji等人于2013年创建,是计算机视觉领域细粒度图像分类的代表性数据集之一。该数据集依托于牛津大学的Visual Geometry Group,旨在解决飞机模型的细粒度识别问题,包含102种不同飞机型号的10200张图片。每种型号有100张图片,涵盖了大部分民用和军用飞机。该数据集的创建,为细粒度视觉分类研究提供了宝贵的资源,对相关领域产生了深远影响。
当前挑战
在构建FGVC-Aircraft数据集的过程中,研究人员面临了多项挑战。首先,飞机型号的多样性带来了标注的困难,需要对不同型号的飞机特征有深入的了解。其次,数据集的构建过程中需要处理大量的图像数据,对存储和计算资源提出了较高要求。此外,为了提高模型的泛化能力,数据集的多样性和平衡性也是构建过程中的一大挑战。
常用场景
经典使用场景
在计算机视觉与机器学习领域,dpdl-benchmark/fgvc_aircraft数据集的典型应用场景在于细粒度图像识别。该数据集包含102种不同飞机模型的10200张图像,每种模型有100张图像,为研究者提供了一个丰富的样本集,以便训练和测试模型对飞机型号的识别能力。
解决学术问题
该数据集解决了细粒度视觉分类的学术难题,特别是在航空器识别领域。它帮助学者们研究如何通过有限的训练样本,实现对复杂类别的高精度识别,从而推动了相关算法的发展和应用。
实际应用
在现实应用中,dpdl-benchmark/fgvc_aircraft数据集可用于航空器制造商的质量控制,机场的安全检查,以及无人机监测系统中的目标识别等场景。它为相关行业提供了自动化的识别工具,提高了工作效率和安全性。
数据集最近研究
最新研究方向
在细粒度图像识别领域,dpdl-benchmark/fgvc_aircraft数据集以其丰富的飞机型号及变体图片资源,成为学者研究的热点。近期研究主要聚焦于提升模型对于飞机家族、制造商及具体型号的识别准确性,探索深度学习模型在航空器识别任务中的应用。此外,研究还涉及如何利用数据增强技术扩充数据集,以及采用迁移学习策略以优化模型性能。这些研究不仅推动了航空器视觉分类技术的发展,也为航空安全管理、飞机维护等领域提供了技术支持。
以上内容由遇见数据集搜集并总结生成



