FedReIDBench

Name: FedReIDBench
Creator: 南洋理工大学, 新加坡
Published: 2020-10-10 01:57:52
License: 暂无描述

arXiv2020-10-10 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2008.11560v2

下载链接

链接失效反馈

官方服务：

资源简介：

FedReIDBench是一个包含9个不同规模和来源的数据集的基准，用于模拟现实世界中的统计异质性情况。这些数据集包括MSMT17、DukeMTMC-reID、Market-1501、CUHK03-NP、PRID2011、CUHK01、VIPeR、3DPeS和iLIDS-VID，用于实现联邦学习到人物再识别（FedReID）。数据集的创建旨在通过模拟数据点的不平衡和非独立同分布（non-IID）问题，来研究FedReID在真实世界场景中的性能优化。该基准还定义了代表性的联邦学习场景，并提出了适用于FedReID的算法，以及标准化模型结构和性能评估指标，为未来的研究和工业化提供了有价值的见解和基准。

FedReIDBench is a benchmark comprising nine datasets with varying scales and sources, designed to simulate statistical heterogeneity in real-world scenarios. These datasets include MSMT17, DukeMTMC-reID, Market-1501, CUHK03-NP, PRID2011, CUHK01, VIPeR, 3DPeS and iLIDS-VID, which are employed to implement Federated Person Re-identification (FedReID). The benchmark is developed to study the performance optimization of FedReID in real-world scenarios by simulating data imbalance and non-independent and identically distributed (non-IID) problems. Additionally, this benchmark defines representative federated learning scenarios, proposes algorithms tailored for FedReID, as well as standardized model structures and performance evaluation metrics, providing valuable insights and benchmarks for future research and industrial applications.

提供机构：

南洋理工大学, 新加坡

创建时间：

2020-08-26

搜集汇总

数据集介绍

构建方式

在联邦学习与行人重识别交叉领域，FedReIDBench的构建旨在模拟现实场景中的统计异构性。该基准整合了九个具有显著差异的行人重识别数据集，涵盖不同规模、场景和摄像头视角，以模拟非独立同分布与数据量不平衡的挑战。通过定义两种联邦场景——基于摄像头的客户端-服务器架构与基于数据集的客户端-边缘-云架构，并引入联邦部分平均算法以处理客户端模型结构差异，该基准为联邦行人重识别研究提供了标准化评估框架。

使用方法

使用FedReIDBench时，研究者首先需预处理九个数据集，并按照联邦场景划分客户端。在训练过程中，采用联邦部分平均算法进行多轮迭代：服务器分发全局模型至客户端，客户端结合本地分类器进行训练并上传骨干网络参数，服务器根据数据量或动态权重聚合更新。评估阶段采用行人重识别的标准指标，如累积匹配特性曲线与平均精度均值，同时考量通信成本。基准提供的参考实现包括数据预处理脚本与优化方法，便于复现与扩展研究。

背景与挑战

背景概述

FedReIDBench数据集于2020年由南洋理工大学与商汤科技的研究团队联合构建，旨在探索联邦学习在行人重识别任务中的实际应用。该数据集聚焦于解决隐私保护与模型性能之间的平衡问题，通过集成九个来源各异、规模不等的行人重识别数据集，模拟真实场景中数据分布的非独立同构性与不平衡性。其核心研究在于优化联邦行人重识别模型的训练效率与泛化能力，为计算机视觉领域在隐私敏感环境下的模型部署提供了重要的基准框架。

当前挑战

FedReIDBench面临的挑战主要体现在两方面：在领域问题层面，行人重识别任务需处理跨摄像头视角下的身份匹配难题，而联邦学习的引入加剧了数据异构性对模型收敛与性能的负面影响，如非独立同构数据导致的训练波动与泛化衰减。在构建过程中，数据集需整合多源异质数据以模拟现实统计异质性，这带来了数据规模差异悬殊、领域鸿沟显著以及模型结构部分异构等挑战，进而要求设计如联邦部分平均等新型算法以适配动态权重聚合与知识蒸馏等优化策略。

常用场景

经典使用场景

在联邦学习与行人重识别交叉领域，FedReIDBench作为首个系统性基准，其经典使用场景聚焦于模拟现实世界中数据分布的异构性。该基准通过整合九个来源各异、规模悬殊的行人重识别数据集，构建了一个高度仿真的非独立同分布环境，为研究者提供了评估联邦学习算法在隐私保护前提下性能表现的标准化平台。其核心应用在于对比分析不同联邦架构（如客户端-服务器与客户端-边缘-云架构）在跨摄像头行人匹配任务中的效能差异，并为优化模型聚合策略提供实证基础。

解决学术问题

FedReIDBench主要解决了联邦学习在视觉任务中面临的统计异构性挑战，即数据非独立同分布与规模不平衡导致的模型收敛困难与性能衰减问题。通过引入动态权重调整与知识蒸馏方法，该基准有效缓解了大规模数据集在聚合过程中因权重失衡而产生的负面影响，同时提升了跨域知识迁移的稳定性。其意义在于为隐私敏感的行人重识别研究开辟了新范式，推动了分布式机器学习理论与计算机视觉应用的深度融合，并为后续异构环境下的联邦学习算法设计提供了关键见解。

实际应用

在实际部署中，FedReIDBench所代表的联邦行人重识别技术可广泛应用于智慧城市安防与社区监控系统。例如，多个独立管理的社区可通过边缘服务器协作训练全局重识别模型，无需共享原始视频数据，既保障了居民隐私，又实现了跨区域的行人追踪能力。该框架还能适应医疗、零售等场景中多机构数据协同分析的需求，为跨域身份识别任务提供安全高效的解决方案，显著降低了数据集中化存储的法律与伦理风险。

数据集最近研究