Office-Home-LDS
收藏Hugging Face2025-03-09 更新2025-03-10 收录
下载链接:
https://huggingface.co/datasets/WeiDai-David/Office-Home-LDS
下载链接
链接失效反馈官方服务:
资源简介:
Office-Home-LDS数据集是在Office-Home数据集基础上构建的,通过在现有的领域偏斜上引入标签偏斜,创建了更具挑战性和现实性的数据集。该数据集包括艺术、剪贴画、产品和真实世界四个领域,并根据不同的Dirichlet分布参数(α)分为多个子数据集,用于图像分类和特征提取任务。
The Office-Home-LDS dataset is constructed based on the Office-Home dataset, where label skew is introduced on top of the existing domain skew to create a more challenging and realistic dataset. It encompasses four domains: Art, Clipart, Product, and Real World, and is divided into multiple sub-datasets according to different Dirichlet distribution parameters (α) for image classification and feature extraction tasks.
创建时间:
2025-03-08
搜集汇总
数据集介绍

构建方式
Office-Home-LDS数据集是在Office-Home数据集的基础上引入标签偏斜,以构建更具挑战性和现实性的数据集。该数据集通过在原始数据集上引入Dirichlet分布来产生不同偏斜程度的训练集和测试集,从而同时展现标签偏斜和领域偏斜的特点。
特点
该数据集的特点在于其同时具有标签偏斜和领域偏斜,通过引入Dirichlet分布来控制不同领域内类别的分布比例,形成了更具挑战性的数据集结构。数据集包含了艺术、剪贴画、产品和真实世界四个领域,共65个类别。
使用方法
使用该数据集时,用户需要先解压下载的压缩文件,然后可以使用提供的Python脚本处理和分割原始数据集。通过调整Dirichlet分布的参数,用户可以创建具有不同偏斜程度的训练和测试数据集。数据集的结构包括训练集、测试集和客户端级别的分割,方便进行联邦学习等任务的研究。
背景与挑战
背景概述
Office-Home-LDS数据集是在Office-Home数据集的基础上,通过引入标签偏斜(label skew)来构建的,旨在形成一个同时展现标签偏斜和领域偏斜的更具挑战性和现实性的数据集。该数据集的创建,是为了在联邦学习的背景下,通过领域知识引导的局部全局分布对齐来解决模型训练中遇到的不平衡问题。该数据集由WeiDai-David等研究人员在2025CVPR会议上提出,并在相关的论文中进行了详细的介绍。
当前挑战
该数据集在构建过程中面临的挑战主要包括如何在保持领域偏斜的同时引入标签偏斜,并确保数据集能够反映现实世界中的分布情况。此外,数据集构建中还涉及到如何有效地对数据集进行划分,以保证在联邦学习环境下的训练和测试的有效性和公平性。在研究领域问题方面,Office-Home-LDS数据集的挑战在于它不仅要解决图像分类的问题,还要解决如何在具有领域和标签偏斜的情况下,保持模型的泛化能力和公平性。
常用场景
经典使用场景
Office-Home-LDS数据集是在Office-Home数据集的基础上引入标签偏斜,以构建更具挑战性和现实性的数据集。该数据集的经典使用场景主要涉及图像分类和特征提取任务,其中最为关键的是对域偏斜和标签偏斜的同时处理,以模拟真实世界中的数据分布不均现象。
衍生相关工作
基于Office-Home-LDS数据集的研究已经衍生出多项相关工作,包括对联邦学习算法的改进、对数据分布不均问题的解决方案以及跨域学习的有效性研究等,进一步推动了联邦学习领域的发展。
数据集最近研究
最新研究方向
Office-Home-LDS数据集是在Office-Home数据集的基础上引入标签偏斜构建而成,旨在同时展现标签偏斜和领域偏斜,为联邦学习等领域提供更具挑战性和现实性的数据集。近期研究关注于利用几何知识指导的局部全局分布对齐方法,以解决联邦学习中的标签偏斜问题,相关研究发表于2025CVPR_GGEUR论文。该研究方向的进展对于提升联邦学习的模型泛化能力和领域适应性具有重要的实践意义。
以上内容由遇见数据集搜集并总结生成



