optimus-dataset
收藏Hugging Face2024-11-16 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/optimus-change/optimus-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含约60万张图像的时间序列,这些图像是2016年1月至2023年12月期间捕获的40-50颗Sentinel-2卫星图像。数据集还包括300个带有二进制'变化'或'无变化'标签的时间序列。时间序列在全球范围内分布,一半的时间序列随机选择覆盖Sentinel-2的地点,另一半则专门采样于城市地区。每张图像为512x512像素,分辨率约为10米/像素。数据集存储在'images'目录下的tar文件中,图像按时间戳和位置命名,使用WebMercator网格系统。此外,数据集还包括其他文件,如'index.json'用于标识tar文件中的图块,以及区分随机和城市采样的JSON文件。数据集由华盛顿大学和Allen Institute of AI的研究人员创建,并根据Apache License 2.0发布。
创建时间:
2024-11-16
原始信息汇总
OPTIMUS Dataset
概述
- 数据量: 约60万张图像时间序列。
- 时间范围: 2016年1月至2023年12月。
- 标签: 包含300个带有二进制“变化”或“无变化”标签的时间序列。
- 用途: 用于训练和评估OPTIMUS模型(待论文链接)。
- 分布: 全球分布,一半时间序列随机选择,另一半专门采样于城市区域。
- 图像分辨率: 每张图像512x512像素,约10米/像素。
- 许可: Apache License 2.0。
数据集详情
图像
-
存储格式: 主要存储在“images”目录下的tar文件中。
-
目录结构:
2016-01/ tci/ 1234_5678.png 2345_6789.png ... 2016-03/ tci/ 1234_5678.png ... 2016-05/ ... ... 2023-11/
-
时间序列: 同一文件名(如
1234_5678.png)在不同时间戳文件夹中的图像构成一个时间序列。 -
坐标系统: 使用WebMercator网格系统,缩放级别为13。
-
图像来源: 从Sentinel-2 L1C场景中裁剪,仅使用B04/B03/B02波段。
其他文件
- index.json: 标识哪些tar文件包含哪些图块。
- 2024_dataset_tiles_random.json 和 2024_dataset_tiles_urban.json: 区分随机全球采样和城市区域采样的图块。
- forest_loss_dataset.tar: 包含额外的时间序列图像,这些图像包含森林损失。
作者
- Raymond Yu (University of Washington)
- Paul Han (University of Washington)
- Josh Myers-Dean (Allen Institute of AI)
- Piper Wolters (Allen Institute of AI)
- Favyen Bastani (Allen Institute of AI)
搜集汇总
数据集介绍

构建方式
OPTIUMUS数据集的构建基于Sentinel-2卫星在2016年1月至2023年12月间捕获的40至50张图像序列,共计约60万条时间序列。其中,300条时间序列被标注为“变化”或“无变化”的二元标签。数据集的采样策略兼顾全球随机分布与城市区域特定采样,确保地理覆盖的广泛性与城市变化的针对性。每张图像分辨率为512x512像素,空间分辨率约为10米/像素,且所有图像均经过重投影至WebMercator坐标系,确保时间序列中的图像在相同位置对齐。
使用方法
使用OPTIUMUS数据集时,用户需首先解压存储于tar文件中的图像数据,图像按时间戳目录结构组织,便于提取特定时间序列。数据集提供了`index.json`文件,用于标识各tar文件包含的图块信息。用户可通过`2024_dataset_tiles_random.json`和`2024_dataset_tiles_urban.json`区分随机采样与城市采样图块。对于变化检测任务,`2024_dataset_evaluation.json`文件提供了300条时间序列的标注信息,用户可根据图像ID获取对应的二元标签。此外,森林损失数据集可用于特定环境变化的研究与分析。
背景与挑战
背景概述
OPTIMUS数据集由华盛顿大学和艾伦人工智能研究所的研究团队于2024年发布,旨在支持卫星图像时间序列分析的研究。该数据集包含约60万条由Sentinel-2卫星在2016年1月至2023年12月期间拍摄的图像时间序列,覆盖全球范围,其中一半数据随机采样,另一半则专注于城市区域。数据集的核心研究问题是通过时间序列分析检测地表变化,特别是城市化和森林损失等环境变化。OPTIMUS数据集的发布为遥感领域的研究提供了重要的数据支持,推动了基于深度学习的卫星图像分析技术的发展。
当前挑战
OPTIMUS数据集在构建和应用过程中面临多重挑战。首先,数据采集和处理涉及大量卫星图像的时空对齐和重投影,这对计算资源和算法精度提出了高要求。其次,尽管数据集包含60万条时间序列,但仅有300条带有标注,数据标注的稀缺性限制了监督学习模型的训练效果。此外,Sentinel-2卫星图像的分辨率有限(10米/像素),在检测细微变化时可能存在精度不足的问题。最后,全球范围的数据分布使得模型需要具备较强的泛化能力,以应对不同地理环境和气候条件下的变化检测任务。
常用场景
经典使用场景
OPTIUS数据集广泛应用于遥感图像时间序列分析领域,特别是在地表变化检测任务中。该数据集通过提供全球范围内的高分辨率Sentinel-2卫星图像时间序列,为研究人员提供了一个丰富的实验平台。其经典使用场景包括训练和评估地表变化检测模型,尤其是针对城市区域和随机全球采样区域的变化检测。
解决学术问题
OPTIUS数据集解决了遥感领域中地表变化检测的关键问题。通过提供大量标注的“变化”与“无变化”时间序列数据,该数据集为研究人员提供了可靠的基准,用于验证和优化变化检测算法。其全球分布的数据样本和城市区域的针对性采样,进一步增强了模型在不同地理环境下的泛化能力,推动了遥感图像分析技术的进步。
实际应用
在实际应用中,OPTIUS数据集被广泛用于监测城市扩张、森林砍伐、自然灾害等环境变化。其高分辨率的图像时间序列为政府部门、环保组织和城市规划者提供了重要的决策支持。例如,通过分析城市区域的时间序列数据,可以精确识别城市扩张的趋势,从而为可持续城市规划提供科学依据。
数据集最近研究
最新研究方向
近年来,随着遥感技术的飞速发展,卫星图像时间序列分析在环境监测、城市规划和灾害预警等领域展现出巨大的应用潜力。OPTIUS数据集作为一项重要的资源,包含了2016年至2023年间Sentinel-2卫星拍摄的约60万张图像时间序列,其中300个时间序列标注了“变化”或“无变化”的二元标签。该数据集不仅覆盖全球范围,还特别针对城市区域进行了采样,为研究全球变化和城市化进程提供了丰富的数据支持。当前,基于OPTIUS数据集的研究主要集中在深度学习模型的训练与评估,特别是在变化检测、土地利用分类和生态系统监测等前沿方向。此外,该数据集还通过引入森林损失时间序列,进一步拓展了其在环境变化研究中的应用场景。OPTIUS数据集的发布,不仅推动了遥感图像分析技术的发展,也为全球环境监测和可持续发展目标的实现提供了重要的数据基础。
以上内容由遇见数据集搜集并总结生成



