five

Federated Learning Client Datasets

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/vdasu/deduplication
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了在联邦学习实验中使用的客户端数据集,旨在分析去重操作对模型性能的影响。数据集的大小可以从2的10次方变化到2的19次方,客户端数量可以从10个到50个不等,且设有30%的数据重复率。该数据集的规模具有多样性,涵盖了不同数据大小和客户端数量的情况,其研究任务专注于联邦学习。

This dataset comprises client datasets utilized in federated learning experiments, with the goal of analyzing the effect of deduplication operations on model performance. The dataset size ranges from 2^10 to 2^19, the number of clients varies between 10 and 50, and a 30% data duplication rate is configured. Boasting diverse scales, this dataset covers scenarios with different data sizes and client quantities, and its research task is specifically focused on federated learning.
提供机构:
Open-sourced by the authors
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作