five

IGNF/FLAIR

收藏
Hugging Face2024-10-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/IGNF/FLAIR
下载链接
链接失效反馈
官方服务:
资源简介:
FLAIR土地覆盖语义分割数据集是一个覆盖法国全国范围的高分辨率航空影像和Sentinel-2卫星影像数据集。该数据集包含超过200亿个标注像素,覆盖了55个不同的空间域,总面积达980平方公里。数据集分为训练/验证集和两个测试集(flair#1-test和flair#2-test),分别侧重于不同的语义类别和输入数据。数据集的结构包括高分辨率航空影像、卫星影像时间序列、云和雪掩膜、高程和土地覆盖标注。该数据集的目标是推动土地覆盖映射技术的发展。

The FLAIR Land Cover Semantic Segmentation Dataset is a high-resolution aerial and Sentinel-2 satellite imagery dataset covering the entire territory of France. It contains over 2 billion annotated pixels, spans 55 distinct spatial domains, and covers a total area of 980 square kilometers. The dataset is split into a training/validation set and two test sets (flair#1-test and flair#2-test), which respectively focus on different semantic categories and input data types. The dataset structure includes high-resolution aerial imagery, satellite image time series, cloud and snow masks, elevation data, and land cover annotations. The goal of this dataset is to advance the development of land cover mapping technologies.
提供机构:
IGNF
原始信息汇总

数据集卡片:FLAIR 土地覆盖语义分割

数据集概述

FLAIR 数据集(#1 和 #2)是一个全国范围采样的数据集,包含超过 200 亿个标注像素的高分辨率航空影像,空间分辨率为 0.2 米,采集自三年内不同月份(时空域)。航空影像补丁包含 5 个通道(RVB-近红外-高程),并带有相应的标注(19 个语义类别或 13 个基线类别)。此外,为了整合更广泛的空间上下文和时间信息,还提供了高分辨率的 Sentinel-2 卫星 1 年时间序列,包含 10 个光谱带。超过 50,000 个 Sentinel-2 采集,空间分辨率为 10 米。

数据集覆盖 55 个不同的空间域,包含 974 个区域,总面积达 980 平方公里。该数据集为推进土地覆盖制图技术提供了坚实的基础。我们基于不同的输入数据和语义类别采样了两个测试集。第一个测试集(flair#1-test)仅使用非常高分辨率的航空影像,主要采样人为化的土地覆盖类别。第二个测试集(flair#2-test)结合了航空和卫星影像,具有更多自然类别,并代表了时间变化。

数据集结构

FLAIR 数据集包含总共 93,462 个补丁:61,712 个补丁用于训练/验证数据集,15,700 个补丁用于 flair#1-test,16,050 个补丁用于 flair#2-test。每个补丁包括一个高分辨率航空影像(512x512),空间分辨率为 0.2 米,一个年度卫星影像时间序列(默认 40x40,提供更广阔的区域),空间分辨率为 10 米,以及相关的云和雪掩膜(在训练/验证和 flair#2-test 中可用),以及像素级精确的高程和土地覆盖标注,分辨率为 0.2 米(512x512)。

波段顺序

  • 航空影像

    1. 绿
    2. 近红外
    3. nDSM
  • 卫星影像

    1. 蓝(B2 490nm)
    2. 绿(B3 560nm)
    3. 红(B4 665nm)
    4. 红边(B5 705nm)
    5. 红边2(B6 470nm)
    6. 红边3(B7 783nm)
    7. 近红外(B8 842nm)
    8. 近红外-红边(B8a 865nm)
    9. 短波红外(B11 1610nm)
    10. 短波红外2(B12 2190nm)

标注

每个像素都通过 20 厘米分辨率航空影像的照片解释手动标注,由地理学专家监督的团队进行。可移动物体如汽车或船只根据其下覆覆盖物进行标注。

数据分割

数据集由 55 个不同的空间域组成,与法国行政区边界对齐。在我们的实验中,我们指定 32 个域用于训练,8 个用于验证,并保留 10 个官方测试集用于 flair#1-test 和 flair#2-test。需要注意的是,一些域在 flair#1-test 和 flair#2-test 数据集中是共同的,但覆盖了域内的不同区域。这种安排确保了语义类别、辐射属性、生物气候条件和采集时间的平衡分布,从而准确反映了法国本土的景观多样性。重要的是,补丁带有元数据,允许采用替代的分割方案。

官方域分割:

  • 训练:D006, D007, D008, D009, D013, D016, D017, D021, D023, D030, D032, D033, D034, D035, D038, D041, D044, D046, D049, D051, D052, D055, D060, D063, D070, D072, D074, D078, D080, D081, D086, D091
  • 验证:D004, D014, D029, D031, D058, D066, D067, D077
  • 测试-flair#1:D012, D022, D026, D064, D068, D071, D075, D076, D083, D085
  • 测试-flair#2:D015, D022, D026, D036, D061, D064, D068, D069, D071, D084

类别分布

以下是训练/验证和两个测试集的类别分布百分比:

类别 训练/验证 (%) 测试 flair#1 (%) 测试 flair#2 (%)
(1) Building 8.14 8.6 3.26
(2) Pervious surface 8.25 7.34 3.82
(3) Impervious surface 13.72 14.98 5.87
(4) Bare soil 3.47 4.36 1.6
(5) Water 4.88 5.98 3.17
(6) Coniferous 2.74 2.39 10.24
(7) Deciduous 15.38 13.91 24.79
(8) Brushwood 6.95 6.91 3.81
(9) Vineyard 3.13 3.87 2.55
(10) Herbaceous vegetation 17.84 22.17 19.76
(11) Agricultural Land 10.98 6.95 18.19
(12) Plowed land 3.88 2.25 1.81
(13) Swimming pool 0.01 0.04 0.02
(14) Snow 0.15 - -
(15) Clear cut 0.15 0.01 0.82
(16) Mixed 0.05 - 0.12
(17) Ligneous 0.01 0.03 -
(18) Greenhouse 0.12 0.2 0.15
(19) Other 0.14 - 0.04
搜集汇总
数据集介绍
main_image_url
构建方式
FLAIR数据集由IGN机构创建,旨在推动土地覆盖制图技术的进步。该数据集由超过20亿个高分辨率航空影像像素组成,空间分辨率为0.2米,跨越三年内不同月份的获取时间。航空影像包括5个通道(RGB-近红外-高程)并带有相应的注释,包括19个语义类别或13个基准类别。此外,为了集成更广泛的时空信息,还提供了高分辨率Sentinel-2卫星1年的时间序列数据,包含10个光谱波段。数据集涵盖了55个不同的空间域,包含980平方公里内的974个区域。
特点
FLAIR数据集的特点在于其高分辨率、多源数据以及时空信息的整合。航空影像提供了细致的地表覆盖细节,而卫星影像则提供了更广阔的视角和长期的变化趋势。数据集包含了人工和自然类别的地表覆盖,并通过两个测试集(flair#1-test和flair#2-test)来评估模型在不同输入数据下的表现。此外,数据集的划分与法国行政区域一致,确保了训练、验证和测试数据集之间的地理和生态多样性。
使用方法
使用FLAIR数据集时,首先需要根据数据集的结构了解其包含的文件和目录。数据集由多个图像块组成,每个块包括高分辨率航空影像、卫星影像时间序列以及相应的注释。用户可以使用提供的基准代码和模型结构作为起点,根据自己的需求进行模型训练和评估。数据集还提供了元数据,允许用户进行不同的划分方案。在使用数据集时,应遵循数据集的许可协议,并在出版物中引用相关文献。
背景与挑战
背景概述
在地理信息系统(GIS)和遥感领域中,土地覆盖图的制作对于环境监测、城市规划以及资源管理等至关重要。IGNF/FLAIR数据集,作为一项前沿研究,致力于通过航空航天影像进行法国土地覆盖的语义分割。该数据集由IGN(法国国家地理信息系统)在2022年创建,汇集了超过20亿个高分辨率(0.2米)的航空影像像素,跨越三年不同月份的采集,涵盖了55个不同的空间域,面积达980平方公里。数据集包含5个通道的航空影像(RGB-近红外-高程),以及对应的高分辨率Sentinel-2卫星1年时序数据。FLAIR数据集为土地覆盖制图技术提供了强大的基础,并在两个测试集中分别关注城市和自然土地覆盖类别,以支持不同类型的研究和应用。
当前挑战
FLAIR数据集面临的主要挑战包括:1) 处理大规模高分辨率数据带来的计算和存储需求;2) 在多源数据融合中保持空间和时间信息的准确性;3) 处理季节性变化和不同地域环境带来的数据异质性;4) 在语义分割任务中准确识别和分类19种不同的土地覆盖类别,包括建筑物、道路、水体、植被等;5) 开发能够有效利用航空影像和卫星影像时空信息的分割模型。这些挑战不仅推动了对土地覆盖语义分割技术的深入研究,也促进了多源遥感数据融合和机器学习算法的创新。
常用场景
经典使用场景
在遥感影像分析领域,IGNF/FLAIR数据集因其高分辨率和多模态特性,成为了土地覆盖语义分割任务的重要数据资源。该数据集不仅包含了法国境内超过20亿个像素的注解,还融合了航空影像与卫星影像数据,为研究者提供了丰富的空间和时间维度信息。研究者可以利用这一数据集,训练深度学习模型,实现对土地覆盖类型的精确分类,如建筑物、植被、水体等。这一应用场景对于城市规划、环境监测和资源管理等领域的决策支持具有重要意义。
实际应用
在实际应用中,IGNF/FLAIR数据集的应用场景广泛。例如,在城市建设中,可以利用该数据集对城市土地覆盖进行详细分类,从而为城市规划和设计提供数据支持。在环境保护方面,该数据集可以用于监测森林、水体等自然资源的分布和变化,为环境保护政策的制定提供科学依据。此外,IGNF/FLAIR数据集还可以用于农业领域,通过对农业用地的分类和监测,提高农业生产的效率和可持续性。
衍生相关工作
IGNF/FLAIR数据集的发布,激发了众多研究者的兴趣,并衍生出了许多相关的研究工作。例如,一些研究者利用该数据集对现有的土地覆盖分类算法进行评估和改进,提出了一些新的分类模型和算法。此外,还有一些研究者利用该数据集探索了多模态数据融合技术在土地覆盖分类中的应用,并取得了一些创新性的成果。这些相关工作的开展,不仅推动了土地覆盖分类技术的发展,也为 IGNF/FLAIR 数据集的进一步应用和推广提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作