five

Sen2LUCAS|遥感数据集|土地利用数据集

收藏
github2024-12-18 更新2024-12-19 收录
遥感
土地利用
下载链接:
https://github.com/pallavijain-pj/SenCLIP
下载链接
链接失效反馈
资源简介:
Sen2LUCAS数据集包含地理标记的Sentinel-2数据,这些数据来自LUCAS 2018数据集,由100x100像素的图像组成,具有三个光谱波段(RGB)。数据是通过Planetary Computers API获取的,重点关注与LUCAS数据相同的月份。为了确保最小云干扰(10-20%云覆盖),收集窗口根据云免费图像的可用性延长了最多±2个月。
创建时间:
2024-11-19
原始信息汇总

SenCLIP: Enhancing zero-shot land-use mapping for Sentinel-2 with ground-level prompting

数据集概述

  • 数据集名称: Sen2LUCAS
  • 数据来源: 数据集包含从LUCAS 2018数据集中获取的带有地理标签的Sentinel-2数据。
  • 数据特征:
    • 图像大小为100x100像素。
    • 包含三个光谱波段(RGB)。
  • 数据获取方式: 使用Planetary Computers API获取数据,重点关注与LUCAS数据相同的月份。
  • 数据处理: 为了确保云层干扰最小化(10-20%的云覆盖),数据收集窗口根据云免费图像的可用性延长了最多±2个月。

模型架构

  • 模型类型: 包含RN50和ViT-B/32架构的变体。
  • 池化方式: 提供平均池化和注意力池化的模型变体。

模型检查点

  • 检查点数量: 共发布了四个模型检查点。

相关资源

参考

AI搜集汇总
数据集介绍
main_image_url
构建方式
Sen2LUCAS数据集的构建基于LUCAS 2018数据集,通过与Sentinel-2卫星图像的精确对齐,形成了包含地理标记的100x100像素RGB图像。数据采集过程中,利用了Planetary Computers API,确保了数据的时间一致性,并根据云层覆盖情况调整了采集窗口,以保证图像质量,云层覆盖率控制在10-20%之间。
特点
Sen2LUCAS数据集的显著特点在于其结合了Sentinel-2卫星图像与LUCAS 2018地面照片,实现了空中与地面视角的融合。这种多层次的数据结构不仅提升了地物分类的准确性,还为零样本学习提供了丰富的视觉语言模型训练数据。此外,数据集的RGB三波段图像设计,使其在处理中分辨率卫星图像时表现出色。
使用方法
Sen2LUCAS数据集适用于多种地物分类任务,尤其是零样本学习场景。用户可以通过提供的模型检查点,快速加载预训练的RN50和ViT-B/32架构模型,进行平均池化或注意力池化的实验。此外,数据集的地面照片与卫星图像对齐特性,使其在需要结合空中与地面视角的任务中具有独特优势,如土地利用与覆盖分类等。
背景与挑战
背景概述
Sen2LUCAS数据集由SenCLIP研究团队创建,旨在解决Sentinel-2卫星影像在零样本土地利用/土地覆盖(LULC)分类中的挑战。该数据集通过将Sentinel-2卫星图像与LUCAS 2018地面照片进行对齐,利用视觉-语言框架CLIP,提升了模型对中分辨率卫星影像的理解能力。Sen2LUCAS数据集的构建基于LUCAS 2018数据集,包含100x100像素的RGB三波段图像,并通过Planetary Computers API获取,确保了数据的时空一致性。该数据集的发布对推动视觉-语言模型在卫星影像分析中的应用具有重要意义,尤其是在提升LULC分类精度方面。
当前挑战
Sen2LUCAS数据集在构建过程中面临多项挑战。首先,卫星影像与地面照片的对齐需要精确的时空匹配,以确保数据的一致性和有效性。其次,Sentinel-2影像中云层覆盖的问题限制了数据的可获取性,研究团队通过扩展数据收集窗口至±2个月,以获取尽可能少的云层干扰图像。此外,如何将预训练的CLIP模型有效适应于卫星影像的零样本分类任务,也是一个技术难点。这些挑战不仅涉及数据获取和处理的复杂性,还包括模型架构的优化和跨模态对齐的技术难题。
常用场景
经典使用场景
Sen2LUCAS数据集的经典使用场景主要集中在零样本土地利用/土地覆盖(LULC)分类任务中。通过将Sentinel-2卫星图像与LUCAS 2018地面照片进行对齐,Sen2LUCAS数据集使得模型能够利用地面视图的详细描述来增强对卫星图像的理解。这种方法在EuroSAT和BigEarthNet等基准数据集上显著提升了LULC分类的准确性,尤其是在使用空中和地面提示的情况下。
衍生相关工作
基于Sen2LUCAS数据集,研究者们开发了多种相关工作,包括改进的视觉-语言模型和更高效的遥感图像处理算法。例如,SenCLIP模型通过结合CLIP和地面视图提示,显著提升了零样本LULC分类的性能。此外,该数据集还激发了其他研究者探索如何在不同地理区域和时间尺度上应用类似的方法,进一步推动了遥感技术的应用和发展。
数据集最近研究
最新研究方向
在遥感与土地利用/土地覆盖(LULC)分类领域,Sen2LUCAS数据集的最新研究方向聚焦于通过视觉-语言模型(如CLIP)实现零样本土地利用映射。该研究通过将Sentinel-2卫星图像与LUCAS 2018地面照片进行对齐,显著提升了模型对中分辨率卫星影像的理解能力。这一方法不仅克服了预训练模型在卫星影像数据上的局限性,还通过结合地面视角的描述,增强了LULC分类的准确性。该研究在EuroSAT和BigEarthNet数据集上的评估结果表明,SenCLIP框架在零样本任务中的表现尤为突出,为遥感领域的智能化应用提供了新的技术路径。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

长江干流实时水位观测数据集(2024年)

该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。

国家地球系统科学数据中心 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录