FedRemoteSensing_Benchmark
收藏Hugging Face2025-03-06 更新2025-03-07 收录
下载链接:
https://huggingface.co/datasets/billhdzhao/FedRemoteSensing_Benchmark
下载链接
链接失效反馈官方服务:
资源简介:
该数据集共有5个标签,分别为:农业、裸地、森林、居民地和河流。数据集由100个客户端组成,每个客户端包含大约350个tif格式的图像。图像来源于6个不同的数据集,包括Eurosat、UC Merced Land Use Dataset、AID、NWPU - RESISC45、WHU-RS19和NaSC-tg2。具体的数据分配情况为:Eurosat数据集的图像分配给46个模拟客户端,UC Merced Land Use Dataset分配给2个,AID分配给5个,NWPU - RESISC45分配给12个,WHU-RS19分配给1个,NaSC-tg2分配给34个。数据集的文件夹结构为:一个名为"data"的文件夹,内部包含训练集文件夹"train_set"和验证集文件夹"val_set"。在训练集文件夹中,每个客户端都有分别对应5个标签的子文件夹,而在验证集文件夹中,也有分别对应5个标签的子文件夹。
This dataset contains 5 distinct labels, namely agriculture, bare land, forest, residential area, and river. It comprises 100 clients, with each client containing approximately 350 TIFF-format images. The images are sourced from six distinct datasets: Eurosat, UC Merced Land Use Dataset, AID, NWPU-RESISC45, WHU-RS19, and NaSC-tg2. The specific data allocation scheme is as follows: Images from the Eurosat dataset are assigned to 46 simulated clients; the UC Merced Land Use Dataset is allocated to 2 clients; the AID dataset to 5 clients; the NWPU-RESISC45 dataset to 12 clients; the WHU-RS19 dataset to 1 client; and the NaSC-tg2 dataset to 34 clients. The folder structure of the dataset is as follows: A top-level folder named "data" contains two subfolders: the training set folder "train_set" and the validation set folder "val_set". Within the training set folder, each client has its own subfolders corresponding to each of the five labels. The validation set folder follows the same structure, with each client having subfolders corresponding to the five labels.
创建时间:
2025-03-03
搜集汇总
数据集介绍

构建方式
FedRemoteSensing_Benchmark数据集的构建,是通过对六个不同遥感图像数据集的整合与分配,形成了含有100个模拟客户端的联邦学习框架。该数据集涵盖了农业、裸地、森林、居民区和河流等五个标签,每个客户端包含大约350张tif格式的图像,从Eurosat、UC Merced Land Use Dataset等六个数据源中按比例分配至各个客户端。
特点
该数据集显著的特点在于其多样化的数据来源和联邦学习的结构设计。不同数据源之间的图像分布不均,有利于模型学习到更广泛的特征。此外,数据集的标签类别平衡,确保了模型训练的公正性和泛化能力。其内部结构清晰,分为训练集和验证集,每个类别都有相应的文件夹,便于数据的管理和访问。
使用方法
在使用FedRemoteSensing_Benchmark数据集时,用户应首先了解其文件夹结构,正确访问训练集和验证集。数据集支持联邦学习框架,因此适用于分布式训练场景。用户需根据客户端分配的数据进行模型训练,并利用验证集对模型性能进行评估。数据集的读取和处理需要相应的图像处理库支持。
背景与挑战
背景概述
FedRemoteSensing_Benchmark数据集,作为一项重要的遥感图像分类资源,诞生于分布式学习与遥感技术交叉融合的研究背景之下。该数据集由100个客户端组成,每个客户端包含大约350个tif格式的图像,涵盖农业、裸地、森林、居民区和河流等五个标签类别。其创建依托于多个知名数据集,如Eurosat、UC Merced Land Use Dataset等,并由多个研究团队共同整合与构建,旨在推动联邦学习在遥感领域的应用。该数据集自推出以来,对推动遥感图像分类技术的发展及其在农业监测、城市规划等领域的实际应用产生了显著影响。
当前挑战
该数据集在解决遥感图像分类问题的过程中,面临诸多挑战。首先,数据分布的异质性问题,即不同客户端数据来源和数量的差异,为联邦学习的模型训练和优化带来了困难。其次,隐私保护和数据安全性的挑战,由于客户端可能包含敏感信息,如何在保证隐私的前提下进行有效学习成为一个关键问题。此外,数据集在构建过程中,还需克服不同数据源之间的整合难题,以及如何确保数据集的均衡性和可扩展性。
常用场景
经典使用场景
在遥感图像分类领域,FedRemoteSensing_Benchmark数据集的经典使用场景在于联邦学习框架下的模型训练与测试。该数据集模拟了分布式环境中各客户端的异构性,为研究人员提供了一个实际且具有挑战性的实验平台,以探究在不同数据分布、客户端数量及数据量条件下的联邦学习算法性能。
解决学术问题
该数据集解决了联邦学习中数据隐私保护与模型泛化能力提升之间的平衡问题。通过提供标签分布非均匀、客户端异构性明显的遥感图像数据,FedRemoteSensing_Benchmark有助于推动联邦学习在遥感领域的研究,为构建更加健壮、隐私保护的遥感图像分类模型提供了实验基础。
衍生相关工作
基于FedRemoteSensing_Benchmark数据集,研究者们开展了一系列相关研究工作,包括但不限于探索更有效的联邦学习算法、设计新的隐私保护机制以及优化客户端间的通信策略。这些研究不仅推动了联邦学习理论的发展,也为实际应用中的隐私保护提供了可行的技术路径。
以上内容由遇见数据集搜集并总结生成



