Overhead-MNIST
收藏arXiv2021-02-08 更新2024-06-21 收录
下载链接:
https://www.kaggle.com/datamunge/overheadmnist 和 https://github.com/reveondivad/ov-mnist
下载链接
链接失效反馈官方服务:
资源简介:
Overhead-MNIST是一个用于卫星图像对象识别的基准数据集,由人民泰克公司创建。该数据集包含10000张28x28像素的灰度图像,涵盖10类常见对象,如飞机、船只和体育场等。数据集通过整合多个公共来源的图像并进行人工标注和筛选而创建,旨在解决卫星图像中的对象识别问题,适用于灾害响应、土地使用管理和传统遥感任务等领域。
Overhead-MNIST is a benchmark dataset for satellite image object recognition, developed by PeopleTec, Inc. It consists of 10,000 28×28 pixel grayscale images spanning 10 common object categories, including aircraft, ships, stadiums, and others. The dataset is created by integrating images from multiple public sources, followed by manual annotation and screening. Its primary goal is to address object recognition challenges in satellite imagery, and it is applicable to fields such as disaster response, land use management, and traditional remote sensing tasks.
提供机构:
人民泰克公司
创建时间:
2021-02-08
搜集汇总
数据集介绍

构建方式
Overhead-MNIST数据集的构建方式是从多个公开来源(如xView、UC Merced Land Use、DOTA和SpaceNet)中选取 overhead 卫星图像,经过提取、缩放、裁剪等预处理步骤,最终形成10个类别的102个标签,每个类别大约1000个样本(除直升机800个,港口1200个),以模拟MNIST格式构建了一个卫星图像识别的基准数据集。
使用方法
使用Overhead-MNIST数据集的方法包括:1)下载三种格式的数据(CSV、JPEG图像、MNIST二进制格式),根据需要选择;2)利用预训练的卷积神经网络(如MobileNetV2)进行迁移学习;3)根据具体任务需求,调整模型参数和训练样本数量;4)评估模型性能时,可以使用测试集进行验证。
背景与挑战
背景概述
Overhead-MNIST数据集是由David A. Noever和Samantha E. Miller Noever于PeopleTec, Inc.提出,旨在通过模仿MNIST数据集的格式,为卫星图像中的物体识别任务提供一个公共基准。该数据集由超过一百万个人工标注和精选的例子组成,遵循了数字识别任务的一般格式要求,提供了一个具有多类物体识别任务的新视角。它不仅在灾害救援、土地利用管理等领域具有潜在应用价值,而且扩展了卫星图像识别的基准,以识别高效且紧凑的算法,适用于小型卫星在轨任务。该数据集的创建时间为近年来,主要研究人员为David A. Noever和Samantha E. Miller Noever,对相关领域产生了显著影响。
当前挑战
Overhead-MNIST数据集在构建过程中遇到了多个挑战。首先,它所解决的领域问题是卫星图像中的物体分类,这要求算法能够处理不同尺度、旋转不变性以及多样化的背景。其次,构建过程中遇到的挑战包括数据集的多样性和平衡性,由于卫星图像的分辨率和视角差异,需要对数据进行适当的预处理和增强。此外,数据标注的一致性和准确性也是一大挑战,尤其是在处理微小细节和复杂场景时。
常用场景
经典使用场景
Overhead-MNIST数据集的经典使用场景在于,它提供了一个从卫星图像中识别10个常见物体的基准任务,这些物体包括动态(如汽车、飞机、直升机、船只)和静态(如停车场、跑道标记、港口)目标以及与基础设施相关的物体(如储油罐、体育场、油气田)。该数据集的格式与MNIST紧密对应,使得研究者可以轻松地将现有的MNIST相关算法和模型应用于卫星图像的识别任务中。
解决学术问题
该数据集解决了学术研究中卫星图像识别的问题,尤其是在物体分类和识别方面。它为研究者提供了一个标准的、易于使用的格式,使得他们可以专注于算法的开发和优化,而无需从头开始构建数据集。此外,Overhead-MNIST的数据量和多样性使得它在训练深度学习模型时具有很高的实用价值,有助于提高模型的泛化能力和准确度。
实际应用
在实际应用中,Overhead-MNIST数据集可以用于卫星图像的分析,例如在灾害救援、土地使用管理以及其他传统遥感任务中。它可以帮助改进卫星图像的识别算法,尤其是在小卫星上运行的算法,这对于未来的多传感器星座任务具有实际意义。
数据集最近研究
最新研究方向
Overhead-MNIST数据集为卫星图像领域带来了新的研究方向,其格式与传统的MNIST数字识别任务相似,但专注于卫星图像中的10个常见物体类别。该数据集不仅继承了MNIST的易用性和广泛的研究基础,还通过引入卫星图像的独特挑战,如图像分辨率和旋转不变性,为算法研究提供了新的视角。最近的研究利用深度学习模型和迁移学习,在Overhead-MNIST数据集上取得了96.4%的平均准确率,超过了人类专家的93.9%识别率。这一成果不仅推动了卫星图像识别技术的发展,还为灾害救援、土地管理等领域的实际应用提供了支持。
相关研究论文
- 1Overhead MNIST: A Benchmark Satellite Dataset人民泰克公司 · 2021年
以上内容由遇见数据集搜集并总结生成



