flwrlabs/synthetic|联邦学习数据集|数据集划分数据集
收藏数据集卡片 for SYNTHETIC
SYNTHETIC 数据集是 LEAF 基准测试的一部分。此版本对应于使用默认参数生成的数据集,具有以下特点:
- 输入 (
x) 长度为 60; - 5 个唯一标签 (
y); - 1000 个唯一设备 (
device_id)。
数据集详情
数据集描述
- 由: LEAF 策划
- 许可证: BSD 2-Clause 许可证
用途
该数据集旨在用于联邦学习设置。
直接使用
我们建议使用 Flower Dataset (flwr-datasets) 和 Flower (flwr)。
要划分数据集,请执行以下操作:
-
安装包。 bash pip install flwr-datasets
-
在 Flower Datasets 中使用 HF Dataset。 python from flwr_datasets import FederatedDataset from flwr_datasets.partitioner import NaturalIdPartitioner
fds = FederatedDataset( dataset="flwrlabs/synthetic", partitioners={"train": NaturalIdPartitioner(partition_by="device_id")} ) partition = fds.load_partition(partition_id=0)
数据集结构
整个数据集保存在训练分割中。如果您想保留数据集的一部分用于集中评估,请使用 Resplitter。(完整的示例即将在此处提供)。
引用
在使用 LEAF 基准测试时,请引用原始论文。如果您在使用此数据集与 Flower Datasets 时,可以引用 Flower。
BibTeX:
@article{DBLP:journals/corr/abs-1812-01097, author = {Sebastian Caldas and Peter Wu and Tian Li and Jakub Kone{v{c}}n{y} and H. Brendan McMahan and Virginia Smith and Ameet Talwalkar}, title = {{LEAF:} {A} Benchmark for Federated Settings}, journal = {CoRR}, volume = {abs/1812.01097}, year = {2018}, url = {http://arxiv.org/abs/1812.01097}, eprinttype = {arXiv}, eprint = {1812.01097}, timestamp = {Wed, 23 Dec 2020 09:35:18 +0100}, biburl = {https://dblp.org/rec/journals/corr/abs-1812-01097.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }
@article{DBLP:journals/corr/abs-2007-14390, author = {Daniel J. Beutel and Taner Topal and Akhil Mathur and Xinchi Qiu and Titouan Parcollet and Nicholas D. Lane}, title = {Flower: {A} Friendly Federated Learning Research Framework}, journal = {CoRR}, volume = {abs/2007.14390}, year = {2020}, url = {https://arxiv.org/abs/2007.14390}, eprinttype = {arXiv}, eprint = {2007.14390}, timestamp = {Mon, 03 Aug 2020 14:32:13 +0200}, biburl = {https://dblp.org/rec/journals/corr/abs-2007-14390.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }
数据集卡片联系
如有任何疑问,请联系 Flower Labs。

