FedMultimodal

Name: FedMultimodal
Creator: 南加州大学
Published: 2023-06-21 04:26:36
License: 暂无描述

arXiv2023-06-21 更新2024-06-21 收录

下载链接：

https://github.com/usc-sail/fed-multimodal

下载链接

链接失效反馈

官方服务：

资源简介：

FedMultimodal是由南加州大学开发的一个多模态联邦学习基准数据集，涵盖了五个代表性的多模态应用场景，包括情感识别、多媒体动作识别、人类活动识别、医疗健康和社交媒体。该数据集包含十个常用数据集，总计涉及八种独特的模态。FedMultimodal提供了一个系统的联邦学习流程，从数据分割和特征提取到联邦学习基准算法和模型评估，支持端到端的建模框架。此外，该数据集还提供了一个标准化方法来评估联邦学习对抗三种常见数据损坏的鲁棒性，包括模态缺失、标签缺失和错误标签。

FedMultimodal is a multimodal federated learning benchmark dataset developed by the University of Southern California. It encompasses five representative multimodal application scenarios, including emotion recognition, multimedia action recognition, human activity recognition, healthcare, and social media. This dataset incorporates ten commonly used datasets, involving a total of eight distinct modalities. FedMultimodal provides a systematic federated learning workflow ranging from data partitioning and feature extraction to federated learning benchmark algorithms and model evaluation, supporting end-to-end modeling frameworks. Additionally, this dataset offers a standardized method to evaluate the robustness of federated learning against three common data corruptions: missing modality, missing label, and incorrect label.

提供机构：

南加州大学

创建时间：

2023-06-16

搜集汇总

数据集介绍

构建方式

FedMultimodal数据集的构建方式是将十个代表性的数据集从十个常用的数据集中挑选出来，涵盖了五种代表性的多模态应用，包括情感识别、多媒体动作识别、人体活动识别、医疗保健和社交媒体分类。这些数据集共包含八种独特的模态。FedMultimodal提供了一个系统化的联邦学习流程，支持从数据划分和特征提取到联邦学习基准算法和模型评估的端到端建模框架。

特点

FedMultimodal数据集的特点包括：1. 包含十个代表性的数据集，涵盖了五种代表性的多模态应用；2. 提供了一个系统化的联邦学习流程，支持从数据划分和特征提取到联邦学习基准算法和模型评估的端到端建模框架；3. 提供了对三种常见数据损坏的鲁棒性评估，包括缺失模态、缺失标签和错误标签。

使用方法

FedMultimodal数据集的使用方法包括：1. 选择合适的数据集和任务；2. 使用提供的特征提取工具进行特征提取；3. 使用提供的联邦学习算法进行模型训练；4. 使用提供的评估工具进行模型评估；5. 使用提供的鲁棒性评估工具进行模型鲁棒性评估。

背景与挑战

背景概述

随着机器学习技术的迅猛发展，现代移动设备和可穿戴传感器在各个行业中的应用日益广泛，从娱乐、交通到医疗和国防等领域，极大地改变了人们的生活、工作和交流方式。这些智能感知设备配备了多模态传感器，可以捕获用户的生理、情感以及丰富的时空环境信息。然而，这些与人类为中心的数据收集引发了用户隐私保护的担忧，特别是在家庭、工作场所、商务会议、医院和学校等敏感环境中。为了解决这一问题，机器学习研究人员开发了联邦学习（Federated Learning, FL）作为一种替代模型构建范式，无需将用户数据从边缘设备传输。FL允许客户端使用本地存储的数据进行本地模型训练，然后将更新后的参数传输到服务器，从而在保护用户隐私的前提下实现模型的协同训练。FedMultimodal数据集正是为了促进多模态联邦学习研究而创建的，它包含了五个具有代表性的多模态应用场景的十个常用数据集，涵盖了八种独特的模态。FedMultimodal提供了一个系统化的FL流程，支持端到端建模框架，从数据分区和特征提取到FL基准算法和模型评估。与现有的FL基准相比，FedMultimodal提供了一种标准化方法来评估FL在实际多模态应用中对抗三种常见数据损坏的鲁棒性：缺失模态、缺失标签和错误标签。FedMultimodal有望加速众多未来的研究方向，包括针对极端数据异质性的多模态FL算法设计、鲁棒性多模态FL和高效多模态FL。

当前挑战

FedMultimodal数据集在多模态联邦学习领域面临着一系列挑战。首先，现有的FL训练算法主要在单模态设置中得到验证，其在多模态任务上的有效性尚未得到充分探索。其次，数据异质性是FL中的关键挑战，尽管许多FL研究专注于单模态设置，但在多模态FL中解决数据异质性的研究还相对较少。此外，FL面临着标签稀缺的挑战，FedMultimodal提供了模拟缺失标签条件的能力，以促进研究人员在多模态FL中进行半监督学习和自监督学习算法的开发。最后，隐私泄露是FL的一个新兴研究方向，FedMultimodal计划探索多模态FL中的隐私泄露问题，并研究差分隐私和secure aggregation等技术来减轻隐私泄露风险。

常用场景

经典使用场景

在日益重视用户隐私保护的背景下，多模态联邦学习（FL）应运而生，旨在通过在本地设备上训练模型，并仅传输更新参数至服务器，以实现协作训练的同时保护用户隐私。FedMultimodal数据集作为首个针对多模态学习应用而设计的FL基准，涵盖了情感识别、多模态动作识别、人类活动识别、医疗保健和社交媒体等五个代表性应用场景，共计十个常用数据集，涵盖了八种独特的模态。该数据集提供了从数据划分和特征提取到FL基准算法和模型评估的系统性FL流程，旨在为多模态FL研究提供一个标准化的评估框架。

实际应用

FedMultimodal数据集的实际应用场景广泛，包括但不限于虚拟助手、人行为分析、AI辅助教育、医疗诊断、社交媒体内容识别等。通过使用该数据集，研究人员可以评估FL模型在实际应用中的性能，并针对特定应用场景进行优化。例如，在情感识别应用中，FedMultimodal数据集可以帮助研究人员开发鲁棒的FL模型，即使在数据缺失或标签错误的情况下，仍能准确识别用户的情感状态。在医疗保健领域，该数据集可以用于开发基于FL的ECG分类模型，帮助医生更准确地诊断心脏疾病。此外，FedMultimodal数据集还可以用于社交媒体内容识别，帮助识别和过滤有害或误导性内容。

衍生相关工作

FedMultimodal数据集的发布，为多模态FL领域的研究开辟了新的方向。基于该数据集，研究人员可以进行多种衍生工作，例如开发新的多模态FL算法、研究模态融合技术、探索数据异构性解决方案等。此外，FedMultimodal数据集还可以与其他FL基准进行对比，评估不同算法在不同应用场景下的性能差异。这些衍生工作有助于推动多模态FL技术的发展，并促进其在更多领域的应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集