SatlasPretrain

Name: SatlasPretrain
Creator: 艾伦人工智能研究所
Published: 2023-08-21 23:09:13
License: 暂无描述

arXiv2023-08-21 更新2024-06-21 收录

下载链接：

https://satlas-pretrain.allen.ai/

下载链接

链接失效反馈

官方服务：

资源简介：

SatlasPretrain是一个大规模的遥感图像理解数据集，由艾伦人工智能研究所创建。该数据集包含3.02亿个标签，覆盖137个类别，涉及水资源监测、森林砍伐追踪、风力涡轮机检测等多个重要地球监测应用。数据集通过结合Sentinel-2和NAIP图像构建，利用多种传感器和时间序列图像，支持模型在处理不同类型传感器图像和利用长距离空间上下文方面的能力。SatlasPretrain的应用领域广泛，旨在解决自动化遥感任务中的挑战，提高模型在特定任务上的性能。

SatlasPretrain is a large-scale remote sensing image understanding dataset created by the Allen Institute for AI. It contains 302 million labels spanning 137 categories, covering a wide range of critical Earth monitoring applications including water resource monitoring, deforestation tracking, wind turbine detection and more. Constructed by combining Sentinel-2 and NAIP imagery, the dataset leverages multiple sensors and time-series images, enabling models to handle diverse sensor-derived images and leverage long-range spatial contextual information. With broad application domains, SatlasPretrain aims to address challenges in automated remote sensing tasks and improve model performance on specific tasks.

提供机构：

艾伦人工智能研究所

创建时间：

2022-11-29

搜集汇总

数据集介绍

构建方式

在遥感影像分析领域，构建大规模、多任务的数据集对于推动自动化方法的发展至关重要。SatlasPretrain数据集通过整合Sentinel-2和NAIP影像，覆盖了856K个地理瓦片，每个瓦片对应Web-Mercator投影下的独立空间区域，面积可达25平方公里。数据构建过程融合了多源标注，包括专家标注、亚马逊众包平台标注以及处理OpenStreetMap、NOAA激光雷达扫描、WorldCover等现有数据集。标注涵盖137个类别，分为七种标签类型，如语义分割、回归、点检测、多边形实例分割等，总计包含3.02亿个标签。为确保数据质量，采用了启发式筛选和人工验证策略，针对低召回类别进行了补充标注，最终实现了超过80%的类别精度高于95%。

使用方法

SatlasPretrain数据集的使用旨在提升遥感影像下游任务的性能。研究人员可通过预训练在该数据集上初始化模型权重，随后针对特定任务进行微调。数据集支持单图像和多图像输入模式，允许模型处理静态对象和动态对象（如船舶和洪水）的预测。使用过程中，可结合Swin Transformer等骨干网络，并利用专门设计的输出头处理不同标签类型。实验表明，在该数据集上预训练的模型在七个下游任务中平均准确率较ImageNet提升18%，较其他遥感基线提升6%，显著增强了模型在少样本场景下的泛化能力。数据集、预训练模型权重及相关代码已公开，便于社区进一步探索和应用。

背景与挑战

背景概述

随着遥感技术的飞速发展，卫星与航空影像已成为地球监测不可或缺的工具，广泛应用于追踪森林砍伐、监测城市扩张及应对非法捕捞等关键领域。然而，遥感影像的多样性与复杂性——从数公里到数十厘米的特征尺度，以及海量的潜在任务——使得开发通用性强的计算机视觉方法面临严峻挑战。在此背景下，艾伦人工智能研究所的研究团队于2023年推出了SatlasPretrain数据集，旨在通过整合Sentinel-2与NAIP影像，构建一个涵盖137个类别、7种标签类型、包含3.02亿标签的大规模遥感数据集，以解决现有数据集规模有限、标签单一的问题，推动遥感图像理解模型的进步。

当前挑战

SatlasPretrain数据集致力于解决遥感图像理解中的核心挑战，即如何构建一个能够处理多任务、多尺度特征的通用模型。具体挑战包括：第一，遥感影像中目标尺寸差异巨大，从广袤的森林到微小的街灯，模型需具备跨尺度的特征识别能力；第二，数据融合困难，需整合来自不同传感器（如多光谱与合成孔径雷达）的时序影像，并有效利用长距离空间上下文信息。在构建过程中，团队面临标签质量与规模的平衡难题，例如从OpenStreetMap等开放数据源提取标签时，需应对召回率不足的问题，并通过启发式规则与人工标注相结合的方式确保测试集的高精度。此外，处理动态对象（如船舶与洪水）与静态对象的时序对齐，以及设计统一模型SatlasNet以支持七种标签类型的联合预测，均是数据集构建与模型开发中的关键挑战。

常用场景

经典使用场景

在遥感图像理解领域，SatlasPretrain数据集以其空前的规模与多样性，为多任务学习提供了经典范例。该数据集整合了Sentinel-2与NAIP影像，涵盖137个类别、7种标签类型，包括点、多边形、折线、分割与回归等。其最典型的应用场景在于支持统一的视觉模型训练，使得单一网络能够同时处理从建筑物提取、道路网络识别到土地覆盖分类等异构任务。通过利用其时空序列图像，模型能够融合不同时间与传感器的信息，显著提升对动态对象如船舶与洪水，以及静态对象如风力涡轮机与森林的检测与分割精度。

解决学术问题

SatlasPretrain数据集有效应对了遥感计算机视觉中的若干核心挑战。首先，它通过提供302百万标签的大规模标注，缓解了以往遥感数据集规模有限、难以充分释放现代架构如Vision Transformer潜力的困境。其次，其多标签类型的统一框架促进了跨任务的知识迁移，为解决遥感中长尾分布、标注稀缺的细分应用（如非法捕鱼监测、冰川消退追踪）提供了预训练基础。实验表明，基于该数据集的预训练能使下游任务平均准确率提升18%（相较于ImageNet），这证实了其在提升模型泛化能力、推动自动化地球监测方面的关键学术价值。

实际应用

SatlasPretrain数据集的实际应用广泛覆盖了全球环境与行星监测的关键领域。其标签直接关联于水资源管理、森林砍伐追踪、可再生能源基础设施测绘、冰川变化监测、洪水检测、城市扩张分析以及船舶检测等现实任务。例如，通过预训练模型在Satlas平台中的部署，实现了对全球风力涡轮机、太阳能农场、海上平台与树木覆盖的月度自动化提取，为减排决策、灾害响应与城市规划提供了及时、高精度的地理空间数据产品。这些应用凸显了数据集在推动遥感技术从研究走向业务化运行中的桥梁作用。

数据集最近研究