FLAIR-HUB
收藏arXiv2025-06-08 更新2025-06-11 收录
下载链接:
https://ignf.github.io/FLAIR/FLAIR-HUB/flairhub
下载链接
链接失效反馈官方服务:
资源简介:
FLAIR-HUB是法国国家地理与森林信息研究所(IGN)推出的一个大规模多模态土地覆盖数据集,拥有超高分辨率(20厘米)的标注,覆盖了法国2528平方公里的区域。该数据集结合了六种对齐的模态,包括航空影像、Sentinel-1/2时间序列、SPOT影像、地形数据以及历史航空影像。FLAIR-HUB包含超过630亿个像素的手工标注,涵盖了19个土地覆盖类别和23种作物类型。数据集的空间分辨率对于土地覆盖分析至关重要,可以精确测量地表和边界,捕捉到诸如房屋、树木或道路等小规模特征。FLAIR-HUB旨在支持监督学习和多模态预训练,并促进大规模语义分割方法的发展。该数据集可用于多模态自我监督方法或数据融合方法的研究,并且将随着新对齐模态或新标注的添加而不断发展。
FLAIR-HUB is a large-scale multimodal land cover dataset launched by the French National Institute of Geographic and Forestry Information (IGN). It features ultra-high-resolution (20 cm) annotations and covers an area of 2528 square kilometers across France. This dataset integrates six aligned modalities, including aerial imagery, Sentinel-1/2 time series, SPOT imagery, topographic data, and historical aerial imagery. FLAIR-HUB contains over 63 billion manually annotated pixels, covering 19 land cover categories and 23 crop types. The spatial resolution of the dataset is critical for land cover analysis, enabling precise measurement of land surfaces and boundaries, as well as capturing small-scale features such as buildings, trees, and roads. FLAIR-HUB aims to support supervised learning and multimodal pre-training, and advance the development of large-scale semantic segmentation methods. It can be utilized for research on multimodal self-supervised methods or data fusion approaches, and will continue to evolve with the addition of new aligned modalities or new annotations.
提供机构:
法国国家地理与森林信息研究所(IGN)
创建时间:
2025-06-08
搜集汇总
数据集介绍

构建方式
FLAIR-HUB数据集由法国国家地理和森林信息研究所(IGN)构建,旨在解决地球观测(EO)数据处理和标注的挑战。该数据集覆盖法国2528平方公里区域,包含六种对齐的多模态数据:航空影像、Sentinel-1/2时间序列、SPOT影像、地形数据及历史航拍图像。数据标注由地理空间专家手工完成,共计标注超过630亿像素,涵盖19种土地覆盖类别和23种作物类型的三级分类体系。数据集采用分层目录结构组织,按空间-时间域和传感器数据类型分类,确保多模态数据的时空一致性。
使用方法
该数据集支持监督学习和多模态预训练,适用于土地覆盖制图、作物分类等语义分割任务。基准实验采用UPerFuse架构,融合Swin Transformer特征提取器和UTAE时空编码器,通过金字塔池化模块实现多尺度特征聚合。用户可通过PyTorch Lightning框架加载标准化数据块,利用提供的元数据(如辐射统计、采集日期)进行预处理。官方划分的train/valid/test集支持跨域验证,五折交叉验证配置可评估模型泛化性。数据集特别适合探索模态互补性,如结合Sentinel-1雷达数据与光学影像提升耕地识别精度。
背景与挑战
背景概述
FLAIR-HUB是由法国国家地理和森林信息研究所(IGN)于2025年推出的多模态土地覆盖和作物分类数据集,作为FLAIR系列数据集的扩展版本。该数据集整合了六种空间对齐的遥感模态,包括20厘米分辨率的航空影像、Sentinel-1/2时间序列、SPOT影像、地形数据及历史航拍图像,覆盖法国2528平方公里区域,包含超过630亿人工标注像素。其核心研究目标是解决高分辨率全球土地覆盖监测中多源异构数据处理与标注的挑战,为土地覆盖精细分类和作物类型映射提供基准数据,支持联合国可持续发展目标中的地表监测需求。数据集通过融合多传感器互补信息,推动了遥感领域多模态融合和深度学习模型(如CNN、Transformer)的研究进展。
当前挑战
FLAIR-HUB面临双重挑战:在领域问题层面,需解决20厘米极高分辨率下土地覆盖细粒度分类(19类)与三级作物分类体系(23/31/46类)的复杂性,其中作物分类受限于LPIS数据申报偏差导致的类别不平衡问题;在构建层面,多模态数据时空对齐(如历史航拍与现代影像配准)、超63亿像素的人工标注质量控制(需达到95%精度阈值),以及六种异构传感器数据(从可见光到SAR)的标准化处理构成主要技术难点。此外,跨年份作物 phenology 差异带来的时序泛化问题,以及多模态融合模型设计中参数分配不平衡(如时空编码器容量差异)也亟待突破。
常用场景
经典使用场景
FLAIR-HUB数据集在土地覆盖和作物类型测绘领域具有广泛的应用场景。该数据集通过整合超高分辨率(20厘米)航空影像、Sentinel-1/2时间序列、SPOT影像、地形数据以及历史航空影像等多模态数据,为研究者提供了丰富的空间、光谱和时间信息。其经典使用场景包括高精度土地覆盖分类、农作物生长监测、以及多模态数据融合算法的验证。特别是在法国本土的大范围土地覆盖测绘中,FLAIR-HUB通过手工标注的63亿像素数据,支持了从城市建筑到农业用地的精细分类。
解决学术问题
FLAIR-HUB数据集解决了遥感领域多个关键学术问题。首先,它填补了高分辨率标注数据与大范围覆盖之间的空白,通过2528平方公里的标注区域,为土地覆盖和作物分类提供了可靠基准。其次,数据集的多模态特性(六种对齐的传感器数据)为多源遥感数据融合研究提供了理想平台,特别是在解决时空分辨率不匹配、跨模态特征对齐等挑战方面。实验表明,使用全部模态时土地覆盖分类准确率达78.2%(mIoU 65.8%),验证了多模态融合对提升细粒度分类性能的有效性。
实际应用
在实际应用层面,FLAIR-HUB直接支持法国国家地理与林业信息院(IGN)的OCS-GE国家土地覆盖参考图生产。其超高分辨率特性可精确识别独立房屋、道路等小尺度地物,满足欧盟无净土地占用(no net land take)等政策监管需求。在农业领域,数据集的三级作物分类体系(23/31/46类)结合LPIS农田地块数据,为共同农业政策(CAP)补贴核查提供技术支撑。此外,历史航空影像模态(1947-1965年)为长时序土地变化分析提供了独特资源。
数据集最近研究
最新研究方向
FLAIR-HUB数据集作为目前最大规模的高分辨率多模态土地覆盖与作物分类数据集,其前沿研究聚焦于多模态融合与跨领域迁移学习。在土地覆盖精细分类方向,研究重点探索如何有效整合航空影像(20cm)、Sentinel-1/2时间序列、SPOT影像等六种对齐模态的互补信息,最新基准测试表明全模态融合可使分类精度达78.2%(mIoU 65.8%)。针对作物类型识别,数据集提供的三级层次化标注体系(23/31/46类)推动了时序特征提取与长尾分布建模的研究,其中Sentinel-2时序数据对耕作周期特征的捕捉显著提升犁地类识别精度3.1%。随着欧盟 deforestation regulation等政策对地表监测要求的提升,该数据集在自监督预训练、历史影像迁移学习(1950s-现代跨时代分析)及超分辨率重建等方向展现出独特价值,其包含的2528km²法国多生物气候带标注数据正推动地理空间基础模型的开发。
相关研究论文
- 1FLAIR-HUB: Large-scale Multimodal Dataset for Land Cover and Crop Mapping法国国家地理与森林信息研究所(IGN) · 2025年
以上内容由遇见数据集搜集并总结生成



