jonathan-roberts1/MultiScene
收藏Hugging Face2023-04-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jonathan-roberts1/MultiScene
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
sequence:
class_label:
names:
'0': apron
'1': baseball field
'2': basketball field
'3': beach
'4': bridge
'5': cemetery
'6': commercial
'7': farmland
'8': woodland
'9': golf course
'10': greenhouse
'11': helipad
'12': lake or pond
'13': oil field
'14': orchard
'15': parking lot
'16': park
'17': pier
'18': port
'19': quarry
'20': railway
'21': residential
'22': river
'23': roundabout
'24': runway
'25': soccer
'26': solar panel
'27': sparse shrub
'28': stadium
'29': storage tank
'30': tennis court
'31': train station
'32': wastewater plant
'33': wind turbine
'34': works
'35': sea
splits:
- name: train
num_bytes: 867506522
num_examples: 14000
download_size: 867005851
dataset_size: 867506522
license: mit
task_categories:
- image-classification
- zero-shot-image-classification
---
# Dataset Card for "MultiScene"
## Dataset Description
- **Paper** [MultiScene: A Large-scale Dataset and Benchmark for Multi-scene Recognition in Single Aerial Images](https://ieeexplore.ieee.org/iel7/36/4358825/09537917.pdf)
- **Split** Clean
### Split Information
This HuggingFace dataset repository contains just the 'Clean' split.
### Licensing Information
MIT.
## Citation Information
[MultiScene: A Large-scale Dataset and Benchmark for Multi-scene Recognition in Single Aerial Images](https://ieeexplore.ieee.org/iel7/36/4358825/09537917.pdf)
```
@article{hua2021multiscene,
title = {MultiScene: A Large-scale Dataset and Benchmark for Multi-scene Recognition in Single Aerial Images},
author = {Hua, Y. and Mou, L. and Jin, P. and Zhu, X. X.},
year = {in press},
journal = {IEEE Transactions on Geoscience and Remote Sensing}
}
```
---
数据集信息:
特征:
- 名称:图像(image),数据类型:图像
- 名称:标签(label),数据类型:序列类别标签,其类别名称对应如下:
0:停机坪(apron)
1:棒球场(baseball field)
2:篮球场(basketball field)
3:海滩(beach)
4:桥梁(bridge)
5:墓地(cemetery)
6:商业区(commercial)
7:农田(farmland)
8:林地(woodland)
9:高尔夫球场(golf course)
10:温室(greenhouse)
11:直升机坪(helipad)
12:湖泊或池塘(lake or pond)
13:油田(oil field)
14:果园(orchard)
15:停车场(parking lot)
16:公园(park)
17:码头(pier)
18:港口(port)
19:采石场(quarry)
20:铁路(railway)
21:居住区(residential)
22:河流(river)
23:环岛(roundabout)
24:跑道(runway)
25:足球场(soccer)
26:太阳能板(solar panel)
27:稀疏灌丛(sparse shrub)
28:体育场(stadium)
29:储槽(storage tank)
30:网球场(tennis court)
31:火车站(train station)
32:污水处理厂(wastewater plant)
33:风力涡轮机(wind turbine)
34:厂区(works)
35:海洋(sea)
划分:
- 名称:训练集(train),数据字节数:867506522,样本数量:14000
下载大小:867005851 字节
数据集总大小:867506522 字节
许可证:MIT协议
任务类别:
- 图像分类(image-classification)
- 零样本图像分类(zero-shot-image-classification)
---
# MultiScene数据集卡片
## 数据集描述
- **论文**:[MultiScene:单张航拍图像多场景识别的大规模数据集与基准测试集(MultiScene: A Large-scale Dataset and Benchmark for Multi-scene Recognition in Single Aerial Images)](https://ieeexplore.ieee.org/iel7/36/4358825/09537917.pdf)
- **划分**:Clean(Clean划分)
### 划分信息
本Hugging Face数据集仓库仅包含“Clean”划分。
### 许可信息
MIT协议。
## 引用信息
[MultiScene:单张航拍图像多场景识别的大规模数据集与基准测试集(MultiScene: A Large-scale Dataset and Benchmark for Multi-scene Recognition in Single Aerial Images)](https://ieeexplore.ieee.org/iel7/36/4358825/09537917.pdf)
@article{hua2021multiscene,
title = {MultiScene:单张航拍图像多场景识别的大规模数据集与基准测试集(MultiScene: A Large-scale Dataset and Benchmark for Multi-scene Recognition in Single Aerial Images)},
author = {Hua, Y. and Mou, L. and Jin, P. and Zhu, X. X.},
year = {待刊(in press)},
journal = {IEEE地球科学与遥感汇刊(IEEE Transactions on Geoscience and Remote Sensing)}
}
提供机构:
jonathan-roberts1
原始信息汇总
数据集概述
数据集名称
- 名称: MultiScene
数据集特征
- 特征:
- image: 图像数据类型
- label: 标签数据类型,包含以下类别:
- 0: apron
- 1: baseball field
- 2: basketball field
- 3: beach
- 4: bridge
- 5: cemetery
- 6: commercial
- 7: farmland
- 8: woodland
- 9: golf course
- 10: greenhouse
- 11: helipad
- 12: lake or pond
- 13: oil field
- 14: orchard
- 15: parking lot
- 16: park
- 17: pier
- 18: port
- 19: quarry
- 20: railway
- 21: residential
- 22: river
- 23: roundabout
- 24: runway
- 25: soccer
- 26: solar panel
- 27: sparse shrub
- 28: stadium
- 29: storage tank
- 30: tennis court
- 31: train station
- 32: wastewater plant
- 33: wind turbine
- 34: works
- 35: sea
数据集分割
- 分割:
- train: 训练集,包含14000个示例,总大小为867506522字节
数据集大小
- 下载大小: 867005851字节
- 数据集大小: 867506522字节
许可证
- 许可证: MIT
任务类别
- 任务类别:
- image-classification
- zero-shot-image-classification
搜集汇总
数据集介绍

构建方式
在遥感影像分析领域,MultiScene数据集通过系统性的数据采集与标注流程构建而成。该数据集源自大规模航空影像,涵盖多样化的地理场景,每一幅图像均经过专业标注,对应一个或多个场景类别。构建过程中,研究团队精心筛选了高分辨率图像,并依据详尽的类别体系进行人工标注,确保了数据的准确性与代表性。数据集的划分遵循严谨标准,提供了训练所需的清洁分割,为多场景识别任务奠定了坚实基础。
特点
MultiScene数据集展现出显著的多场景识别特性,其标注体系覆盖了从自然景观到人工设施的广泛类别,如林地、农田、居住区及运动场等。数据规模庞大,包含数千个样本,每个样本均关联多个场景标签,反映了真实世界中的复杂场景组合。图像质量高,分辨率一致,便于模型学习细微特征。该数据集的设计兼顾了类别多样性与标注精度,为遥感图像分析提供了丰富的多标签学习资源。
使用方法
使用MultiScene数据集时,研究人员可将其应用于图像分类与零样本图像分类等任务。通过加载数据集中的图像与对应标签,用户能够训练深度学习模型以识别单张航空影像中的多个场景。数据集支持标准的数据分割,便于进行模型训练与评估。在实际应用中,建议结合预训练模型或迁移学习技术,以充分利用数据集的多样性与规模优势,提升多场景识别性能。
背景与挑战
背景概述
遥感影像场景理解是地理信息科学和计算机视觉交叉领域的前沿课题,其核心在于从高空视角解析复杂的地表覆盖与人工结构。MultiScene数据集由Y. Hua、L. Mou、P. Jin和X. X. Zhu等学者于2021年构建,旨在推动单张航空影像中的多场景识别研究。该数据集涵盖了从围裙、运动场地到水体、工业设施等36类多样化的场景类别,共包含14000张标注样本,为遥感影像的细粒度语义解析提供了大规模基准。它的出现显著丰富了遥感领域的数据资源,促进了深度学习模型在环境监测、城市规划等实际应用中的性能提升。
当前挑战
在遥感影像分析领域,单张图像常包含多种交织的地物类型,传统分类方法难以准确解析这种复杂的空间共存关系。MultiScene数据集直面多场景识别这一核心挑战,要求模型能够同时检测并区分影像中并存的多个场景类别,如农田与居民区、港口与风电场的混合呈现。数据构建过程中,标注工作面临巨大困难,因为航空影像中场景边界模糊、类内差异显著,且部分类别如稀疏灌木与林地容易混淆,需要领域专家进行精细判别,确保标注的一致性与可靠性。
常用场景
经典使用场景
在遥感影像分析领域,MultiScene数据集为多场景识别任务提供了关键支撑。该数据集包含大量单张航空图像,每张图像标注了多个场景类别,如农田、林地、住宅区等,共计36类。经典使用场景集中于训练和评估深度学习模型,特别是卷积神经网络和视觉Transformer,以实现在单幅遥感影像中同时识别多种地物场景。研究者利用其丰富的标注信息,开发能够理解复杂空间布局与场景共现关系的算法,推动遥感图像解译从单一标签分类向多标签、细粒度识别的演进。
实际应用
在实际应用层面,MultiScene数据集支撑了众多遥感相关的工程与决策系统。基于该数据集训练的模型可应用于城市规划,自动识别城市中的住宅、商业区、停车场等基础设施分布;在农业监测中,精准区分农田、果园、温室等地类,助力作物估产与土地利用管理;环境监管领域则能有效检测水体、林地、风电设施等,评估生态变化与人类活动影响。这些应用提升了遥感数据自动化处理的效率与精度,为智慧城市、精准农业和可持续发展提供了可靠的技术基础。
衍生相关工作
围绕MultiScene数据集,学术界衍生了一系列经典研究工作。这些工作主要集中在多标签遥感图像分类模型的创新上,例如结合注意力机制与图卷积网络以建模场景间关系,或利用多尺度特征融合提升细粒度识别能力。部分研究进一步探索了零样本或小样本学习设定,以应对遥感场景中类别不均衡或新增地物类型的挑战。此外,该数据集也常作为基准,用于评估迁移学习、自监督学习在遥感领域的适应性,推动了跨域泛化与模型可解释性方面的进展。
以上内容由遇见数据集搜集并总结生成



