FedRS
收藏arXiv2025-05-13 更新2025-05-15 收录
下载链接:
https://fedrs-bench.github.io/
下载链接
链接失效反馈资源简介:
FedRS是一个现实联邦遥感数据集,包含八个覆盖不同传感器和分辨率的子数据集,并构建了135个客户端。每个客户端的数据来自同一来源,展现出真实的联邦特性,如偏斜的标签分布、不平衡的客户数据量以及跨客户端的领域异质性。这些特征反映了联邦遥感中的实际挑战,并支持在大规模上评估联邦学习方法。FedRS-Bench基于FedRS构建,实现了10个基线联邦学习算法和评估指标,以构建全面的基准测试。实验结果表明,联邦学习在训练独立数据孤岛上的模型性能方面具有一致性改进,同时揭示了在不同客户端异质性和可用性条件下,不同方法的性能权衡。FedRS及其源代码已公开发布,旨在促进遥感领域大规模联邦学习研究的公平评估和快速发展。
提供机构:
上海交通大学
创建时间:
2025-05-13
原始信息汇总
FedRS-Bench: 遥感领域真实联邦学习数据集与基准
数据集概述
- 名称:FedRS
- 领域:遥感(RS)图像
- 特点:覆盖多种传感器和分辨率,包含135个客户端,反映真实联邦场景特性
核心特性
- 真实联邦属性:
- 倾斜的标签分布
- 不平衡的客户端数据量
- 跨客户端的域异质性
- 应用场景:
- 数百个地面站或卫星观测不同区域
- 支持大规模联邦学习方法评估
数据集构成
- 包含8个不同数据集
- 数据来源:每个客户端数据来自同一源
基准测试(FedRS-Bench)
- 实现10种基线联邦学习算法
- 提供标准化评估指标
- 实验结果:
- 联邦学习相比孤立数据训练能持续提升模型性能
- 揭示不同方法在客户端异质性和可用性条件下的性能权衡
研究价值
- 解决现有工作中手动划分单一数据集的问题
- 提供标准化测试平台促进公平比较
- 加速大规模真实联邦学习在遥感领域的研究
资源获取
联系方式
- 邮箱:zhaohaodong@sjtu.edu.cn
AI搜集汇总
数据集介绍

构建方式
FedRS数据集通过整合八个不同的遥感数据集构建而成,这些数据集覆盖了多种传感器和分辨率,确保了数据来源的多样性和真实性。在构建过程中,每个客户端的数据均来自同一数据源,以模拟真实世界中的数据孤岛现象。数据集经过预处理,统一图像分辨率为64x64,并建立了包含15个语义类别的统一分类体系,以解决原始数据集间标签不一致的问题。此外,数据集采用两种非独立同分布的数据划分方式(NIID-1和NIID-2),以全面评估联邦学习算法在不同数据分布下的性能。
特点
FedRS数据集具有显著的真实性和异构性特点。首先,数据集包含135个客户端,每个客户端的数据来源单一,体现了真实场景中数据的分布特性。其次,数据集中存在标签分布倾斜、客户端数据量不平衡以及跨客户端的领域异构性,这些特性反映了实际遥感数据中的挑战。此外,数据集还涵盖了多种分辨率和传感器类型,进一步增强了其多样性和代表性。这些特点使得FedRS成为一个能够全面评估联邦学习算法在真实场景下性能的理想测试平台。
使用方法
FedRS数据集的使用方法包括数据加载、模型训练和性能评估三个主要步骤。研究人员可以通过提供的源代码加载数据集,并利用内置的10种联邦学习基线算法进行模型训练。在训练过程中,每个通信轮次仅激活部分客户端(如10个),以模拟真实世界中的部分参与情况。评估阶段采用两种测试集(TI和TB)来衡量模型在不同数据分布下的性能。此外,数据集还支持使用预训练模型进行部分参数更新,以进一步优化训练效率和模型性能。通过FedRS-Bench,研究人员可以系统地比较不同算法在异构数据环境下的表现,并推动联邦学习在遥感领域的应用研究。
背景与挑战
背景概述
FedRS数据集由上海交通大学的Haodong Zhao等人于2025年提出,旨在解决遥感(RS)领域中联邦学习(FL)缺乏真实基准数据集的问题。该数据集整合了八个不同的遥感数据集,涵盖多种传感器和分辨率,构建了135个客户端,模拟了真实世界中的地理分布和机构分散的数据特性。FedRS的创建填补了遥感领域联邦学习研究的空白,为相关领域提供了一个标准化、丰富的测试平台,推动了大规模、真实场景下联邦学习技术的发展。
当前挑战
FedRS数据集面临的挑战主要包括:1) 领域问题的挑战:遥感图像具有地理分布广泛、数据量大且隐私敏感的特点,传统的集中式训练难以应对数据共享限制和隐私问题;2) 构建过程中的挑战:数据集需要整合多个来源的遥感数据,处理不同传感器和分辨率的图像,同时确保客户端数据的标签分布偏斜、数据量不平衡以及跨客户端的领域异质性,这些特性增加了数据集的构建难度和复杂性。
常用场景
经典使用场景
FedRS数据集在遥感领域的联邦学习研究中扮演了重要角色,其经典使用场景包括多源遥感图像的场景分类任务。该数据集通过整合八个不同的遥感数据集,构建了135个具有真实联邦特性的客户端,每个客户端的数据来自同一来源,呈现出标签分布偏斜、数据量不平衡以及跨客户端的领域异质性等特点。这些特性使得FedRS成为评估联邦学习算法在真实遥感场景中性能的理想平台。
解决学术问题
FedRS数据集解决了遥感领域中联邦学习研究的关键问题,包括数据隐私保护、跨机构数据共享限制以及多源数据异质性带来的模型训练挑战。通过提供标准化的测试平台,FedRS使得研究者能够公平比较不同联邦学习算法在真实场景下的性能,从而推动遥感领域联邦学习技术的发展。此外,该数据集还支持对算法在部分客户端参与、客户端数据量不平衡等复杂条件下的鲁棒性评估。
衍生相关工作
FedRS数据集衍生了一系列相关研究工作,包括FedRS-Bench基准测试平台的构建,该平台实现了10种基线联邦学习算法并提供了全面的评估指标。此外,基于FedRS的研究还探索了联邦学习中的个性化模型、领域适应和多模态传感器数据融合等高级主题。例如,FedRSClip利用FedRS数据集评估了联邦学习在遥感场景分类中的应用,而FedDisco等算法则在FedRS上验证了其在异质数据环境下的性能优势。这些工作进一步推动了联邦学习在遥感领域的实际应用和发展。
以上内容由AI搜集并总结生成



