MillionST
收藏arXiv2025-05-14 更新2025-05-20 收录
下载链接:
https://github.com/MiliLab/TiMo
下载链接
链接失效反馈官方服务:
资源简介:
MillionST是一个大规模的卫星图像时间序列数据集,由来自100,000个地理位置的100万张图像组成。每个位置在五年内被拍摄了10个时间阶段的图像,涵盖了广泛的地理空间变化和季节变化。该数据集被设计用于时空预训练,以帮助模型学习通用的时空表示,从而在下游任务中提高性能。MillionST包含大约一百万个样本,每个样本都从10个时间阶段中捕获图像,跨越五年。这种广泛的时空多样性增强了模型对复杂时空模式的捕捉能力。
MillionST is a large-scale satellite image time series dataset composed of 1 million images collected from 100,000 geographic locations. Each location was imaged in 10 temporal phases over a five-year span, covering a wide spectrum of geospatial and seasonal variations. This dataset is designed for spatiotemporal pre-training, with the goal of enabling models to learn generalizable spatiotemporal representations and thereby improving their performance on downstream tasks. MillionST contains approximately one million samples, each of which comprises images captured across 10 temporal phases over a five-year period. Such extensive spatiotemporal diversity enhances the model's ability to capture complex spatiotemporal patterns.
提供机构:
武汉大学, 中关村学院, 国防科技大学
创建时间:
2025-05-14
搜集汇总
数据集介绍

构建方式
MillionST数据集的构建采用了多阶段采样策略,以确保数据的时空多样性。首先,基于全球人口最多的10,000个城市列表,选取了欧洲、北非和西亚的1,317个城市作为采样中心。随后,采用高斯分布方法在每个城市周围50公里范围内随机选取地理坐标,确保空间覆盖的广泛性。在时间维度上,以2017年下半年为起点,每隔六个月采集一次图像,持续五年,共获得10个时间点的数据。每个时间点的图像采集窗口为±15天,以应对云层覆盖等不可控因素。最终构建的数据集包含来自100,000个地理位置的100万张Sentinel-2多光谱图像,覆盖12个光谱波段(10m/20m/60m分辨率),每个图像覆盖2.65×2.65公里区域。
特点
该数据集的核心优势体现在三个方面:时空覆盖的完备性、光谱信息的丰富性以及变化模式的多样性。其时间跨度长达五年且包含十个均匀分布的时间节点,能完整捕捉地表物体的季节性和年际变化规律。空间分布上覆盖多种地貌类型和气候带,包括城市、农田、森林和水体等典型地物。光谱维度包含可见光到短波红外的12个波段,为多光谱分析提供坚实基础。特别值得注意的是,数据集通过精心设计的时空采样策略,确保了地表覆盖变化(如作物轮作、城市扩张)和突发性事件(如洪水、森林退化)的充分表征,为模型学习通用时空特征提供了理想条件。
使用方法
该数据集专为时空自监督预训练设计,主要配合掩码图像建模(Masked Image Modeling)框架使用。具体实施时,建议采用75%的高掩码率对时空令牌进行随机遮蔽,通过重建原始像素值来训练模型。在硬件配置方面,推荐使用多块NVIDIA RTX 4090 GPU进行分布式训练,基础学习率设为1.5×10^-4,采用AdamW优化器并配合余弦衰减学习率调度。预训练周期建议设置为100轮(含10轮热身阶段),批处理规模保持128。对于下游任务微调,可根据具体应用场景(如地物分类或变化检测)选择不同层次的时空特征:浅层特征适用于细粒度分割任务,而深层抽象特征更适合场景级分类。数据集提供的多时间相位数据支持灵活的时间采样策略,既能固定时间序列分析,也可随机选取子序列以增强模型鲁棒性。
背景与挑战
背景概述
MillionST数据集由武汉大学、中关村研究院和国防科技大学的研究团队于2025年创建,旨在解决卫星图像时间序列(SITS)分析中的多尺度时空关系建模问题。该数据集包含来自10万个地理位置的100万张Sentinel-2多光谱图像,每个位置跨越5年内的10个时间相位,涵盖了丰富的地理空间变化和季节性特征。作为首个具备长期密集时间覆盖的大规模SITS预训练数据集,MillionST通过时空掩码图像建模方法支撑了TiMo基础模型的开发,显著提升了森林退化监测、土地覆盖分割等下游任务的性能,推动了遥感时空基础模型研究范式的革新。
当前挑战
MillionST面临的挑战主要体现在两个维度:在领域问题层面,传统遥感基础模型受限于单时相图像分析,难以捕捉地表物体的动态演变规律;而现有SITS数据集普遍存在时间分辨率不足(通常≤5个时间戳)的问题,制约了模型对长期时空模式的学习能力。在构建过程中,研究团队需克服多时相数据对齐、跨年度影像质量一致性控制等技术难点,特别是在处理云层遮挡、传感器差异等噪声干扰时,需开发复杂的时空滤波和归一化算法来保证数据质量。此外,百万级样本的存储与计算优化也对分布式处理架构提出了严峻挑战。
常用场景
经典使用场景
MillionST数据集作为卫星图像时间序列(SITS)分析的预训练数据集,广泛应用于环境监测、灾害评估和农业分类等领域。其多时相、多光谱的特性使其成为研究地表动态变化的理想选择。通过捕捉不同时间点的地表变化,MillionST为模型提供了丰富的时空信息,使其能够更好地理解地表变化的模式和趋势。
衍生相关工作
MillionST的推出催生了一系列相关研究,特别是在时空基础模型的开发上。例如,TiMo模型利用该数据集进行预训练,通过其独特的时空陀螺注意力机制,显著提升了模型在多种遥感任务中的性能。此外,该数据集还被用于改进现有的自监督学习方法,推动了遥感图像分析领域的技术进步。
数据集最近研究
最新研究方向
近年来,MillionST数据集在遥感时序分析领域的前沿研究主要集中在时空基础模型的构建与优化。该数据集通过整合来自10万个地理位置的100万张Sentinel-2多时相影像,覆盖五年内10个时间节点的观测数据,为自监督学习提供了丰富的时空变化特征。研究热点包括基于层次化视觉Transformer的时空表征学习(如TiMo模型),其核心创新点——时空陀螺注意力机制(STGA)通过显式建模地物多尺度时空关联,显著提升了森林退化监测、洪灾评估等下游任务的性能。该数据集通过增强模型对季节性变化和长期地物演化的捕捉能力,推动了遥感基础模型从静态单时相分析向动态时序理解的范式转变,并为应对气候变化监测等全球性挑战提供了新的技术路径。
相关研究论文
- 1TiMo: Spatiotemporal Foundation Model for Satellite Image Time Series武汉大学, 中关村学院, 国防科技大学 · 2025年
以上内容由遇见数据集搜集并总结生成



