five

GFM-Bench/DFC2020|遥感图像分析数据集|土地覆盖分类数据集

收藏
hugging_face2025-03-27 更新2025-04-26 收录
遥感图像分析
土地覆盖分类
下载链接:
https://hf-mirror.com/datasets/GFM-Bench/DFC2020
下载链接
链接失效反馈
资源简介:
DFC2020数据集是一个用于地物覆盖分类和语义分割的大规模遥感数据集,包含Sentinel-1和Sentinel-2影像。经过重新划分,该数据集包含训练集41537样本,验证集4615样本,测试集8874样本,所有图像均为96x96像素。数据集的特征包括雷达图像、光学图像、分割标签以及各个波段中心波长和空间分辨率信息。

The DFC2020 dataset is a large-scale remote sensing dataset designed for land cover classification and semantic segmentation tasks, containing Sentinel-1 and Sentinel-2 images. After reclassification, the dataset includes a training set of 41,537 samples, a validation set of 4,615 samples, and a test set of 8,874 samples, with all images being 96x96 pixels. The dataset features include radar images, optical images, segmentation labels, as well as central wavelengths and spatial resolution information for each band.
提供机构:
GFM-Bench
AI搜集汇总
数据集介绍
main_image_url
构建方式
GFM-Bench/DFC2020数据集的构建,旨在服务于土地覆盖分类和语义分割任务。该数据集融合了Sentinel-1和Sentinel-2两种遥感图像,原始数据集仅包含验证集986个样本和测试集5,128个样本。为提升数据集的使用效率,研究团队将原始测试集作为训练和验证集,原始验证集作为测试集。此外,遵循[CROMA](https://arxiv.org/abs/2311.00566)的方法,将256 x 256像素的图像细分为9个96 x 96像素的小块,并保留16像素的重叠。最终构建的训练集包含41,537个样本,验证集包含4,615个样本,测试集包含8,874个样本,所有图像均为96 x 96像素。
特点
GFM-Bench/DFC2020数据集的特点在于其大规模的遥感图像集合,以及精细的图像分割处理。数据集涵盖了Sentinel-1和Sentinel-2的多个波段,提供了丰富的地物信息。图像分辨率的调整和波段的重叠设计,使得数据集在多尺度分析中表现出较高的灵活性和适用性。此外,数据集的类别数量为8类,有助于聚焦于特定土地覆盖类型的识别和分类。
使用方法
使用GFM-Bench/DFC2020数据集时,用户可通过调用datasets库中的load_dataset函数直接加载。加载后的数据集分为训练集、验证集和测试集,便于进行模型训练和评估。每个样本包含雷达图像、光学图像、分割标签以及相关的波长和空间分辨率信息。用户可参考[GFM-Bench](https://github.com/uiuctml/GFM-Bench)仓库中的详细文档,以获取更多关于数据集使用的信息和方法。
背景与挑战
背景概述
在遥感领域,土地覆盖分类与语义分割是至关重要的任务,其结果对于环境监测、资源管理和城市规划等具有深远影响。DFC2020数据集,创建于2020年,由Robinson等研究人员精心构建,旨在为这些任务提供一个大规模的遥感图像数据集。该数据集包含了Sentinel-1和Sentinel-2两种类型的图像,其独特之处在于将原始测试集作为训练和验证集,原始验证集作为测试集,并进一步将图像细分为更小的块以增加样本量。DFC2020数据集在推动遥感图像分割技术的发展上发挥了重要作用,为相关研究提供了宝贵的资源。
当前挑战
尽管DFC2020数据集为土地覆盖分类和语义分割研究提供了强大的支持,但在实际应用中仍面临诸多挑战。首先,遥感图像的解析受多种因素影响,如季节变化、天气条件等,这增加了分类和分割的复杂性。其次,数据集构建过程中,如何合理分割图像、选择合适的特征以及处理不同波段的数据,都是研究者必须面对的问题。此外,数据集的标注质量直接关系到模型的训练效果,而高质量的标注往往需要大量的人力和时间投入。
常用场景
经典使用场景
在地球观测与远程感知领域,GFM-Bench/DFC2020数据集因其庞大的规模和精细的标注,被广泛用于土地覆盖分类与语义分割任务。该数据集整合了Sentinel-1与Sentinel-2卫星图像,为研究者提供了一个综合性的研究平台,使其能够深入分析不同波段图像特征,进而提高分类与分割的准确性。
实际应用
实际应用中,GFM-Bench/DFC2020数据集可用于城市规划、灾害监测、生态环境评估等多个领域。借助该数据集训练出的模型,能够有效辅助决策者进行土地利用规划,提高应急响应的效率,对可持续发展具有显著影响。
衍生相关工作
基于GFM-Bench/DFC2020数据集,学术界已衍生出一系列相关工作,包括多模态数据融合、弱监督学习等前沿技术的探索。这些研究不仅推动了遥感图像分析技术的发展,也为地球系统模型的构建提供了新的视角和方法论。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域250米植被覆盖度数据集(2000-2024)

该数据集是中国区域2000至2024年月度植被覆盖度产品,空间分辨率250米,合成方式采用月最大值合成,每年12期,共299期。本产品采用基于归一化植被指数(NDVI)像元二分模型,根据土地利用类型确定纯植被像元值和纯裸土像元值,实现植被覆盖度计算。本产品去除湖泊、河流、冰川/永久积雪等区域。其中,NDVI数据来源于国家青藏高原科学数据中心中国区域250米归一化植被指数数据集(2000-2024)产品。通过时空变化趋势分析检验法分析,该数据集符合时间变化趋势和空间变化趋势。该数据集能够为全国区域生态质量评价、重要生态空间调查评估等工作提供数据参考。

国家青藏高原科学数据中心 收录

clane9/imagenet-100

ImageNet-100是原始ImageNet-1k数据集的一个子集,包含随机选择的100个类别。此外,图像的较短边被调整为160像素。数据集包含图像和标签两个主要字段,标签是基于imagenet100.txt文件中的synset id索引的。数据集分为训练集和验证集,分别包含126689和5000个样本。

hugging_face 收录

LEVIR-CD

LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。

OpenDataLab 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

UAVid

UAVId 是一个高分辨率的无人机语义分割数据集作为补充,它带来了新的挑战,包括大规模变化、运动物体识别和时间一致性保持。 UAV 数据集由 30 个视频序列组成,这些视频序列在倾斜视图中捕获 4K 高分辨率图像。总共有 300 张图像被密集标记为 8 个类别,用于语义标记任务。

OpenDataLab 收录