Million-AID|遥感图像数据集|场景分类数据集

arXiv2021-03-30 更新2024-08-06 收录

遥感图像

场景分类

下载链接：

http://arxiv.org/abs/2006.12485v2

下载链接

链接失效反馈

资源简介：

Million-AID是一个新的、大规模的基准数据集，包含一百万个实例，用于遥感图像场景分类。

创建时间：

2020-06-23

AI搜集汇总

数据集介绍

构建方式

Million-AID 数据集的构建采用了语义坐标收集策略和交互式注释方法。首先，通过利用公共地图搜索引擎、开源数据和公共地理数据库资源，收集了具有特定语义标签的地理坐标。然后，使用这些坐标从 Google Earth 中提取场景图像，并根据场景规模和分辨率，将图像分为不同的尺寸。最后，通过人工检查和删除操作，确保了场景图像的正确性和质量。

特点

Million-AID 数据集具有以下特点：1）多样性：每个场景类别中的图像都是从世界不同地区提取的，这大大增强了场景图像的内部多样性。同时，大规模的语义类别也提高了场景图像的类别间多样性。2）丰富性：Million-AID 数据集中的图像主要来自 Google Earth，这些图像来自不同的卫星，并具有广泛的分辨率。此外，还收集了在不同成像条件下拍摄的图像，以增加场景图像的丰富性。3）可扩展性：Million-AID 数据集的构建过程遵循半自动注释模式，可以有效地减少人工成本并确保标签质量。同时，构建的类别层次结构可以轻松地嵌入新的场景类别，这为数据集的扩展和持续可用性提供了保障。

使用方法

Million-AID 数据集可以用于场景分类、目标检测、语义分割和变化检测等遥感图像解释任务。使用数据集时，可以根据具体任务选择合适的场景类别和图像尺寸。同时，还可以利用数据集中的注释信息，对遥感图像进行语义分析和内容理解。

背景与挑战

背景概述

随着遥感（RS）图像解释技术的飞速发展及其在环境监测、资源调查、城市规划等领域的广泛应用，对RS图像的自动解释提出了更高的要求。Million-AID数据集正是在这一背景下创建的，它是一个大规模的RS图像场景分类基准数据集，包含了超过一百万个实例。该数据集由Yang Long等人创建，旨在解决现有RS图像数据集在规模、多样性和语义类别上的不足，为RS图像解释算法的研究和开发提供一个可靠的平台。

当前挑战

Million-AID数据集面临着一系列挑战，包括：1）构建过程中所遇到的挑战，例如，如何高效地准备一个适合RS图像解释的基准数据集，以及如何有效地收集和标注大规模的RS图像；2）RS图像解释领域的挑战，例如，如何提高算法的泛化能力，如何更好地表征真实世界场景中的特征分布，以及如何建立一个公平的比较平台，以评估和优化不同的解释算法。

常用场景

经典使用场景

Million-AID 数据集作为一个大规模的遥感图像场景分类数据集，其经典使用场景在于为遥感图像场景分类算法提供训练和测试数据。该数据集包含了100万张遥感图像，涵盖了51个场景类别，具有高多样性、丰富性和可扩展性，能够有效表征现实世界中的场景特征分布。通过使用 Million-AID 数据集，研究者可以训练出具有强大特征表示和泛化能力的场景分类模型，从而实现遥感图像的自动解释和内容理解。

衍生相关工作

Million-AID 数据集的构建和发布推动了遥感图像解释领域的相关研究。例如，一些研究者基于 Million-AID 数据集开展了场景分类算法的研究，提出了新的模型和方法，提高了算法的性能和效率。此外，一些研究者还基于 Million-AID 数据集开展了目标检测、语义分割等遥感图像解释任务的研究，为相关领域的发展提供了新的思路和方法。Million-AID 数据集的发布和应用，为遥感图像解释领域的研究和发展做出了重要贡献。

数据集最近研究

相关研究论文

1
On Creating Benchmark Dataset for Aerial Image Interpretation: Reviews, Guidances and Million-AID · 2021年

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

MedDialog

MedDialog数据集（中文）包含了医生和患者之间的对话（中文）。它有110万个对话和400万个话语。数据还在不断增长，会有更多的对话加入。原始对话来自好大夫网。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展，让高质量机器人数据触手可及，作为上海模塑申城语料普惠计划中的一份子，智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思，重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目，旨在构建国际领先的开源技术底座，标志着具身智能领域「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集，AgiBot World 的长程数据规模高出 10 倍，场景范围覆盖面扩大 100 倍，数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能，从抓取、放置、推、拉等基础操作，到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互，几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性，12位男性)，以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情，歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常，强烈) 下产生的，另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位，48kHz .wav)，音频-视频 (720p H.264，AAC 48kHz，.mp4) 和仅视频 (无声音)。注意，Actor_18没有歌曲文件。

OpenDataLab 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息，涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类，提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

ISIC 2018

ISIC 2018数据集包含2594张皮肤病变图像，用于皮肤癌检测任务。数据集分为训练集、验证集和测试集，每张图像都附有详细的元数据，包括病变类型、患者年龄、性别和解剖部位等信息。

challenge2018.isic-archive.com 收录