five

LandDiscover50K (LD50K)

收藏
github2025-01-02 更新2025-01-04 收录
下载链接:
https://github.com/yecy749/GSNet
下载链接
链接失效反馈
官方服务:
资源简介:
LandDiscover50K (LD50K) 是一个包含51,846张遥感图像的数据集,覆盖了40个不同的语义类别。该数据集基于现有的RSISS数据集(如OEM、LoveDA、DeepGlobe、SAMRS),提供了大规模、多领域、多粒度的遥感图像,并带有全面的类别标注,旨在提升开放词汇遥感图像语义分割(OVRSISS)的性能。

LandDiscover50K (LD50K) is a dataset containing 51,846 remote sensing images covering 40 distinct semantic categories. Built upon existing RSISS datasets including OEM, LoveDA, DeepGlobe and SAMRS, this dataset provides large-scale, multi-domain, multi-granularity remote sensing images with comprehensive category annotations, aiming to enhance the performance of open-vocabulary remote sensing image semantic segmentation (OVRSISS).
创建时间:
2024-12-18
原始信息汇总

数据集概述

数据集名称

LandDiscover50K (LD50K)

数据集简介

  • 目标:支持开放词汇遥感图像语义分割(Open-Vocabulary RSI Semantic Segmentation, OVRSISS)。
  • 特点:包含51,846张遥感图像,涵盖40个不同的语义类别。
  • 来源:基于多个已有的遥感图像语义分割数据集,包括OEM、LoveDA、DeepGlobe和SAMRS。
  • 优势:提供大规模、多领域、多粒度的遥感图像,并带有全面的类别标注,提升了OVRSISS的性能。

数据集结构

  • 训练数据集:LandDiscover50K

    • 下载地址:HuggingFace Repo
    • 数据合并与解压: bash cat LD50KSplit.z* > LandDiscover50K.zip unzip LandDiscover50K.zip -d ./dst_dir
  • 测试数据集:FloodNet、FLAIR、FAST、Potsdam

数据目录结构

$DETECTRON2_DATASETS
├── LandDiscover50K
│ ├── GT_ID
│ └── TR_Image
├── FAST
│ └── val
│ ├── images
│ └── semlabels
├── PotsdamSplit
│ ├── ann_dir
│ └── img_dir
├── FLAIR
│ └── test
│ ├── image
│ └── mask
├── FloodNet
│ └── val+test
│ ├── img │ └── lbl

相关论文

  • 论文标题:Towards Open-Vocabulary Remote Sensing Image Semantic Segmentation
  • 作者:Chengyang Ye, Yunzhi Zhuge, Pingping Zhang
  • 会议:AAAI 2025
  • 论文链接:arXiv

引用

bibtex @inproceedings{ye2025GSNet, title={Towards Open-Vocabulary Remote Sensing Image Semantic Segmentation}, author={Ye, Chengyang and Zhuge, Yunzhi and Zhang, Pingping}, booktitle={Proceedings of the AAAI Conference on Artificial Intelligence}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
LandDiscover50K (LD50K) 数据集的构建基于多个已建立的遥感图像语义分割数据集,包括OEM、LoveDA、DeepGlobe和SAMRS。该数据集通过整合这些数据集的图像和标注信息,进一步扩展了其规模和多样性。LD50K包含了51,846张遥感图像,覆盖了40个不同的语义类别,旨在为开放词汇遥感图像语义分割任务提供大规模、多领域、多粒度的图像数据支持。数据集的构建过程注重类别的全面性和标注的准确性,以确保其在开放词汇场景下的广泛应用。
特点
LD50K数据集的特点在于其大规模、多领域和多粒度的遥感图像数据。该数据集不仅涵盖了丰富的语义类别,还提供了高质量的标注信息,能够有效支持开放词汇遥感图像语义分割任务。LD50K的图像来源多样,涵盖了城市、乡村、自然景观等多个领域,确保了数据集的广泛适用性。此外,数据集的标注信息经过精心设计,能够满足不同粒度下的语义分割需求,为模型的训练和评估提供了坚实的基础。
使用方法
使用LD50K数据集时,用户需首先从Hugging Face仓库下载数据集,并通过命令行工具将分卷文件合并为完整的压缩包。解压后,数据集应按照指定的目录结构进行组织,以便与Detectron2等深度学习框架兼容。用户可以通过提供的训练脚本进行模型训练,并使用预训练权重进行模型评估。LD50K数据集还提供了多个测试数据集(如FloodNet、FLAIR等),用户可以直接下载并使用这些数据集进行模型性能的验证。详细的训练和评估步骤可在GitHub仓库中找到。
背景与挑战
背景概述
LandDiscover50K (LD50K) 数据集由Chengyang Ye、Yunzhi Zhuge和Pingping Zhang等研究人员于2025年提出,旨在推动开放词汇遥感图像语义分割(OVRSISS)领域的研究。该数据集包含51,846张遥感图像,覆盖40个多样化的语义类别,建立在OEM、LoveDA、DeepGlobe和SAMRS等现有遥感图像语义分割数据集的基础上。LD50K通过提供大规模、多领域、多粒度的遥感图像及其详尽的类别标注,显著提升了开放词汇遥感图像语义分割的性能。该数据集的发布为遥感图像分析领域提供了新的研究工具,推动了开放词汇识别技术的发展。
当前挑战
LD50K数据集在解决开放词汇遥感图像语义分割问题时面临多重挑战。首先,遥感图像通常具有复杂的场景结构和多样的地物类别,如何在不进行微调的情况下实现对任意语义类别的准确分割是一个核心难题。其次,数据集的构建过程中需要处理大规模、多源遥感数据的采集与标注,确保数据的多样性和标注的准确性。此外,遥感图像的多尺度特性要求模型具备强大的特征提取能力,以应对不同粒度地物的识别需求。这些挑战不仅考验了数据集的构建质量,也对后续模型的开发与优化提出了更高的要求。
常用场景
经典使用场景
LandDiscover50K(LD50K)数据集在遥感图像语义分割领域具有广泛的应用,尤其是在开放词汇遥感图像语义分割(OVRSISS)任务中表现出色。该数据集通过提供大规模、多领域、多粒度的遥感图像及其详细的类别标注,为研究人员提供了一个强大的工具,用于训练和评估开放词汇语义分割模型。其经典使用场景包括城市土地利用分类、自然灾害监测以及农业资源管理等领域。
实际应用
在实际应用中,LD50K数据集为城市规划、环境监测和灾害响应等场景提供了重要支持。例如,在城市规划中,该数据集可以帮助识别建筑物、道路和绿地等基础设施的分布情况;在环境监测中,可用于追踪森林覆盖变化或水体污染情况;在灾害响应中,能够快速评估洪水、地震等自然灾害对地表的影响。这些应用场景展示了LD50K在提升遥感图像分析精度和效率方面的巨大潜力。
衍生相关工作
LD50K数据集的发布催生了一系列相关研究工作,尤其是在开放词汇遥感图像语义分割领域。基于该数据集,研究人员提出了多种创新模型和方法,如GSNet(Generalist and Specialist Network),该模型通过结合通用视觉模型和领域专用模型,显著提升了分割性能。此外,LD50K还推动了与其他遥感数据集的融合研究,如与FloodNet、FLAIR等数据集的联合使用,进一步拓展了遥感图像分析的应用边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作