five

FedAIoT|物联网人工智能数据集|联邦学习数据集

收藏
arXiv2023-09-30 更新2024-06-21 收录
物联网人工智能
联邦学习
下载链接:
https://github.com/AIoT-MLSys-Lab/FedAIoT
下载链接
链接失效反馈
资源简介:
FedAIoT是一个专为物联网人工智能(AIoT)设计的联邦学习(FL)基准,包含从多种真实IoT设备收集的八个高质量数据集。这些数据集涵盖了独特的IoT数据模式,如无线数据、无人机图像和智能家居传感器数据,旨在解决AIoT中的代表性应用问题。FedAIoT还提供了一个统一的端到端FL框架,简化了数据集性能的基准测试过程,并针对IoT设备的资源限制进行了优化。
提供机构:
俄亥俄州立大学
创建时间:
2023-09-30
AI搜集汇总
数据集介绍
main_image_url
构建方式
FedAIoT 数据集的构建方式独具匠心,它包含了来自广泛的真实物联网设备的数据集。这些数据集涵盖了无线数据、无人机图像、智能家居传感器数据等多种物联网特有的数据模态。为了确保数据集能够代表物联网应用的多样性,FedAIoT 精选了八种数据集,这些数据集分别来自智能手表、智能手机、WiFi 路由器、无人机、智能家居传感器和头戴式设备。此外,为了简化基准测试,FedAIoT 还提供了一个统一的端到端联邦学习框架,该框架涵盖了联邦学习在物联网领域的整个流程,包括非独立同分布(non-IID)数据分区、物联网特定的数据预处理、物联网友好的模型、联邦学习超参数和物联网因素模拟器。通过这种方式,FedAIoT 为联邦学习在物联网领域的应用提供了宝贵的基准资源。
特点
FedAIoT 数据集的特点主要体现在其真实性和多样性上。它包括了来自真实物联网设备的数据集,这些数据集反映了物联网数据特有的模态和挑战。此外,FedAIoT 还涵盖了多种物联网应用,这些应用是其他技术所无法实现的。为了满足不同研究者的需求,FedAIoT 提供了不同大小的数据集,从小型到大型,以便研究者可以根据自己的计算资源选择合适的数据集进行算法开发和评估。
使用方法
使用 FedAIoT 数据集的方法主要包括以下几个步骤:首先,研究者需要根据自身的研究目标和计算资源选择合适的数据集。然后,利用 FedAIoT 提供的端到端联邦学习框架,进行非独立同分布数据分区、物联网特定的数据预处理、物联网友好的模型选择、联邦学习超参数设置和物联网因素模拟。最后,通过比较不同联邦学习算法在 FedAIoT 数据集上的性能,研究者可以评估算法的有效性,并为联邦学习在物联网领域的应用提供有价值的见解。
背景与挑战
背景概述
在人工智能物联网(AIoT)领域,联邦学习(FL)具有显著的相关性。然而,现有的联邦学习研究大多没有在真实的物联网设备收集的数据集上进行,这些设备捕捉到了独特的模态和物联网数据固有的挑战。为了填补这一关键空白,我们介绍了FedAIoT,这是一个针对AIoT的联邦学习基准。FedAIoT包括从广泛的真实物联网设备中收集的八个数据集,这些数据集涵盖了独特的物联网模态,并针对AIoT的代表性应用。FedAIoT还包括一个统一的端到端FL框架,用于简化数据集性能的基准测试。我们的基准测试结果揭示了FL在AIoT领域的机遇和挑战。我们希望FedAIoT能成为一个宝贵的资源,以促进联邦学习在AIoT这一重要领域的进步。
当前挑战
尽管FL在AIoT领域具有显著的相关性,但大多数现有的FL工作都是在CIFAR-10和CIFAR-100等知名数据集上进行的。然而,这些数据集并非源自真实的物联网设备,因此无法捕捉到与现实世界物联网数据相关的独特模态和固有挑战。为了解决这一问题,FedAIoT提供了从智能手表、智能手机和Wi-Fi路由器到无人机、智能家居传感器和头戴设备等一系列真实的物联网设备收集的数据集。这些数据集包含了无线数据、无人机图像和智能家居传感器数据等独特的物联网数据模态,这些模态在现有的FL基准中尚未得到探索。此外,这些数据集还针对一些最具代表性的AIoT应用和创新用例,这些应用和用例是其他技术无法实现的。
常用场景
经典使用场景
在人工智能物联网(AIoT)领域,联邦学习(FL)具有显著的关联性。然而,大多数现有的FL工作并非在从真实物联网设备收集的数据集上进行的,这些设备捕捉到独特的模态和物联网数据的内在挑战。为了填补这一关键空白,我们引入了FedAIoT,这是一个AIoT的FL基准。FedAIoT包括从广泛的物联网设备中收集的八个数据集。这些数据集涵盖了独特的物联网模态,并针对AIoT的一些最具代表性的应用程序。FedAIoT还包括一个统一的端到端FL框架,用于简化数据集性能的基准测试。我们的基准测试结果揭示了FL在AIoT中的机遇和挑战。我们希望FedAIoT能成为推动FL在AIoT这一重要领域进步的宝贵资源。
衍生相关工作
FedAIoT的衍生相关工作包括但不限于针对物联网设备的FL算法开发、物联网特定数据预处理技术的研究和物联网友好型模型的探索。此外,FedAIoT还推动了针对物联网数据的FL基准测试框架的发展,这些框架可以用于评估FL算法的性能和鲁棒性。FedAIoT还促进了针对物联网数据的高效FL算法的研究,这些算法可以减少通信成本和设备内存需求。FedAIoT为FL在AIoT领域的进一步研究和发展提供了一个重要的基础,推动了这一领域的创新和技术进步。
数据集最近研究
最新研究方向
在人工智能物联网(AIoT)领域,联邦学习(FL)技术因其能够在保护隐私的同时从设备数据中提取知识而备受关注。然而,现有的联邦学习研究大多基于通用数据集,如CIFAR-10和CIFAR-100,这些数据集并非来自真实的物联网设备,无法捕捉到物联网数据的独特模态和固有挑战。为了填补这一空白,研究者们提出了FedAIoT,一个针对AIoT的联邦学习基准。FedAIoT包含了来自智能手表、智能手机、Wi-Fi路由器、无人机、智能家居传感器和头戴式设备等多种物联网设备的八个数据集,涵盖了无线数据、无人机图像、智能家居传感器数据等独特的物联网数据模态。此外,FedAIoT还提供了一个统一的端到端联邦学习框架,简化了对数据集性能的基准测试。通过系统地测试这些数据集,FedAIoT揭示了联邦学习在AIoT领域的机遇和挑战,为推动联邦学习在AIoT领域的发展提供了宝贵的资源。
相关研究论文
  • 1
    FedAIoT: A Federated Learning Benchmark for Artificial Intelligence of Things俄亥俄州立大学 · 2023年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

TM-Senti

TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。

arXiv 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录