five

GrokLST|地表温度数据集|卫星遥感数据集

收藏
arXiv2024-09-30 更新2024-10-02 收录
地表温度
卫星遥感
下载链接:
https://github.com/GrokCV/GrokLST
下载链接
链接失效反馈
资源简介:
GrokLST数据集是由南京理工大学计算机科学与工程学院创建的高分辨率地表温度(LST)数据集,包含641对低分辨率和高分辨率的LST图像及其多模态辅助数据。数据集的创建过程涉及从SDGSAT-1卫星数据中提取和处理,旨在解决卫星遥感中时空分辨率权衡的问题。该数据集主要应用于环境研究、城市热岛分析、森林火灾监测等领域,旨在提供高精度的LST数据,以支持复杂的地表温度模式分析和预测。
提供机构:
南京理工大学计算机科学与工程学院
创建时间:
2024-09-30
原始信息汇总

GrokLST 数据集概述

数据集下载

数据集结构

文件夹结构

shell data ├──black_river_lst (每个文件夹下有641个mat文件)
├── 30m
│ ├── guidance (引导信息)
│ ├── lst (LST数据)
├── 60m
│ ├── guidance
│ ├── lst
├── 120m
│ ├── guidance
│ ├── lst
├── 240m
│ ├── guidance
│ ├── lst
├── split (train:val:test=6:1:3)
│ ├── train.txt
│ ├── val.txt
│ ├── trainval.txt (tarin+val)
│ ├── test.txt
├── README_BRLST.md

数据详情

  • guidance 文件夹: 包含10种辅助引导波段信息,按通道拼接,顺序为"dem", "deepblue", "blue", "green", "red", "vre", "nir", "ndmvi", "ndvi", "ndwi"。
  • lst 文件夹: 包含LST数据,其中"30m"分辨率的LST数据为GT,其他分辨率的LST数据为低分辨率数据。
  • split 文件夹: 数据集划分策略,train:val:test=6:1:3,trainval:test=7:3。

数据集详情表

分辨率 scale crop size crop step h/w guidance.shape (h,w,c)
30m - 512 256 512 512x512x10
60m x2 256 128 256 256x256x10
120m x4 128 64 128 128x128x10
240m x8 64 32 64 64x64x10
AI搜集汇总
数据集介绍
main_image_url
构建方式
GrokLST数据集的构建基于SDGSAT-1卫星的多光谱成像仪(MII)和热红外光谱仪(TIS)的数据。数据处理流程包括相对辐射校正、波段配准、高动态范围(HDR)融合、远程过程调用(RPC)处理和正射校正。地表温度(LST)的提取采用三通道分裂窗(TCSW)算法,结合10米分辨率的多光谱数据计算归一化差异水体指数(NDWI)、归一化差异建筑指数(NDBI)和归一化差异植被指数(NDVI)。表面发射率的计算结合了SDGSAT-1的热红外通道和ASTER全球发射率数据集(GEDv3),使用NDVI阈值法。大气校正进一步使用ECMWF再分析数据(ERA5)和MODTRAN 5.2进行优化。
特点
GrokLST数据集包含641对低分辨率和高分辨率的LST图像,以及多种辅助数据,如数字高程模型(DEM)、深蓝波段、蓝波段、绿波段、红波段、近红外波段(NIR)、NDWI、NDVI和NDMVI。这些数据为精确的LST建模提供了丰富的上下文信息。数据集的分辨率为30米,通过Wald协议下采样到60米、120米和240米,以适应不同的下采样挑战。数据集被划分为训练集、验证集和测试集,分别占60%、10%和30%。
使用方法
GrokLST数据集主要用于地表温度(LST)下采样任务的研究和评估。用户可以通过GrokLST工具包访问该数据集,该工具包提供了超过40种最先进的超分辨率模型,支持模型开发和训练的高灵活性和速度。工具包还包括专门的数据加载器、数据增强管道和LST特定的评估指标,以确保在不同环境条件下准确评估模型性能。GrokLST数据集和工具包的结合为LST下采样领域的研究和应用提供了坚实的基础。
背景与挑战
背景概述
GrokLST数据集由南京理工大学、南京邮电大学和南京信息工程大学等机构的研究人员共同创建,旨在解决地表温度(LST)数据高分辨率获取的挑战。该数据集的构建时间可追溯至2021年,主要研究人员包括Qun Dai、Chunyang Yuan、Yimian Dai等。其核心研究问题是如何在高时空分辨率之间取得平衡,以提高LST数据的准确性和可用性。GrokLST数据集的推出,为环境研究、城市热岛分析、森林火灾监测等领域提供了重要的数据支持,极大地推动了相关领域的发展。
当前挑战
GrokLST数据集在构建过程中面临多项挑战。首先,卫星遥感技术中的时空分辨率权衡问题使得获取高分辨率LST数据变得困难。其次,现有的LST降尺度方法往往忽视了空间非平稳性,导致模型在不同区域的适用性受限。此外,缺乏开放源码的生态系统和非常高的分辨率基准数据集,也阻碍了深度学习方法在该领域的应用和发展。这些挑战不仅影响了LST数据的精度和可靠性,也限制了其在实际应用中的广泛使用。
常用场景
经典使用场景
GrokLST数据集在土地表面温度(LST)降尺度研究中具有经典应用场景。该数据集通过提供高分辨率的LST图像及其相应的多模态辅助数据,使得研究人员能够开发和验证新的降尺度算法。这些算法通过融合多模态数据,动态调整感受野,从而提高LST预测的准确性。GrokLST数据集的开放性和标准化特性,使其成为评估和比较不同降尺度方法的理想平台。
衍生相关工作
GrokLST数据集的发布催生了一系列相关研究工作。例如,基于该数据集的Modality-Conditional Large Selective Kernel(MoCoLSK)网络架构,通过动态融合多模态数据,显著提升了LST降尺度的性能。此外,GrokLST工具包的推出,为研究人员提供了丰富的深度学习模型和评估工具,促进了LST降尺度技术的快速发展。这些衍生工作不仅扩展了GrokLST数据集的应用范围,也为其他遥感数据处理领域提供了新的思路和方法。
数据集最近研究
最新研究方向
近年来,GrokLST数据集在土地表面温度(LST)降尺度领域引起了广泛关注。该数据集不仅提供了高分辨率的LST数据,还引入了多模态融合技术,以解决卫星遥感中时空分辨率权衡的挑战。最新研究方向主要集中在动态调整感受野和多模态特征融合上,通过引入Modality-Conditional Large Selective Kernel(MoCoLSK)网络架构,实现了对多光谱数据复杂依赖性和细微变化的精准捕捉。此外,GrokLST项目还构建了一个开放源代码生态系统,包括GrokLST数据集和工具包,为深度学习方法在LST降尺度领域的应用提供了标准化平台,推动了该领域的前沿研究和技术进步。
相关研究论文
  • 1
    GrokLST: Towards High-Resolution Benchmark and Toolkit for Land Surface Temperature Downscaling南京理工大学计算机科学与工程学院 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese Words and Phrases)

这些语料库的最新版本提供了100维度和200维度的向量表示形式,也就是嵌入,适用于中文和英文。具体来说,有超过1200万个中文单词和短语以及650万个英语单词和短语,它们是在大规模高质量数据上进行预先培训的。这些向量捕获单词和短语的语义含义,可以广泛应用于许多下游任务 (例如,命名实体识别和文本分类) 以及进一步的研究中。

OpenDataLab 收录