five

The Dark (and Bright) Side of IoT: Attacks and Countermeasures for Identifying Smart Home Devices and Services Dataset

收藏
github2022-05-11 更新2024-05-31 收录
下载链接:
https://github.com/AMHD/The-Dark-and-Bright-Side-of-IoT-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于研究智能家居设备和服务的安全性,通过收集和分析IoT设备的网络流量数据,识别设备类型和服务。数据集包括多种智能家居设备(如Amazon Echo和Google Nest Mini)的网络通信数据,每份数据包含时间戳和数据包大小等信息。

This dataset is utilized for investigating the security of smart home devices and services. It identifies device types and services by collecting and analyzing network traffic data from IoT devices. The dataset encompasses network communication data from various smart home devices, such as Amazon Echo and Google Nest Mini, with each data entry including information like timestamps and packet sizes.
创建时间:
2020-10-19
原始信息汇总

数据集概述

数据集名称

The Dark (and Bright) Side of IoT: Attacks and Countermeasures for Identifying Smart Home Devices and Services -- Dataset

数据收集方法

  • 使用[Airodump-ng]识别受害接入点和连接设备。
  • 获取设备的MAC地址和WiFi信道信息。
  • 设置Alfa卡信道与智能设备信道一致。
  • 使用[TCPDump]或[Wireshark]收集并过滤来自接入点至各IoT设备的流量。
  • 提取每条无线消息的时间和包大小。

数据集内容

  • Amazon Echo -- Music
  • Amazon Echo -- News
  • Amazon Echo Dot -- Music
  • Amazon Echo Dot -- News
  • Google Nest Mini -- Music

文件格式

  • RAW Time: 捕获开始以来的秒数
  • RAW Packet size: 字节数

引用信息

当使用此数据集时,请按以下方式引用相关论文:

@inproceedings{hussain2020dark, title="{The Dark (and Bright) Side of IoT: Attacks and Countermeasures for Identifying Smart Home Devices and Services}", author={Hussain, Ahmed Mohamed and Oligeri, Gabriele and Voigt, Thiemo}, booktitle={International Conference on Security, Privacy and Anonymity in Computation, Communication and Storage}, pages={122--136}, year={2020}, organization={Springer} }

@article{hussain2020dark, title="{The Dark (and Bright) Side of IoT: Attacks and Countermeasures for Identifying Smart Home Devices and Services}", author={Hussain, Ahmed Mohamed and Oligeri, Gabriele and Voigt, Thiemo}, journal={arXiv preprint arXiv:2009.07672}, year={2020} }

@InProceedings{hussainIoTDark, author="Hussain, Ahmed Mohamed and Oligeri, Gabriele and Voigt, Thiemo", editor="Wang, Guojun and Chen, Bing and Li, Wei and Di Pietro, Roberto and Yan, Xuefeng and Han, Hao", title="{The Dark (and Bright) Side of IoT: Attacks and Countermeasures for Identifying Smart Home Devices and Services}", booktitle="Security, Privacy, and Anonymity in Computation, Communication, and Storage", year="2021", publisher="Springer International Publishing", address="Cham", pages="122--136", abstract="We present a new machine learning-based attack that exploits network patterns to detect the presence of smart IoT devices and running services in the WiFi radio spectrum. We perform an extensive measurement campaign of data collection, and we build up a model describing the traffic patterns characterizing three popular IoT smart home devices, i.e., Google Nest Mini, Amazon Echo, and Amazon Echo Dot. We prove that it is possible to detect and identify with overwhelming probability their presence and the services running by the aforementioned devices in a crowded WiFi scenario. This work proves that standard encryption techniques alone are not sufficient to protect the privacy of the end-user, since the network traffic itself exposes the presence of both the device and the associated service. While more work is required to prevent non-trusted third parties to detect and identify the users devices, we introduce Eclipse, a technique to mitigate these types of attacks, which reshapes the traffic making the identification of the devices and the associated services similar to the random classification baseline.", isbn="978-3-030-68884-4" }

许可证

GPL-3.0

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建过程基于对智能家居设备及其服务的网络流量进行深度分析。研究人员首先使用Airodump-ng工具识别目标接入点及其连接的设备,获取设备的MAC地址和使用的WiFi信道。随后,通过设置Alfa卡的信道与智能设备一致,利用TCPDump或Wireshark进行流量捕获,并过滤出从接入点到每个物联网设备的流量。最后,提取每条无线消息的时间戳和数据包大小,形成数据集的核心内容。
特点
该数据集聚焦于智能家居设备的网络流量模式,涵盖了多种设备与服务组合,如Amazon Echo和Google Nest Mini在不同服务场景下的流量数据。每个数据文件包含两个关键字段:RAW Time(捕获开始后的秒数)和RAW Packet size(数据包大小,单位为字节)。这些数据为研究智能设备的网络行为及其隐私泄露风险提供了详实的实验基础。
使用方法
该数据集的使用方法较为直观,用户可通过GitHub直接访问原始数据文件。每个文件对应特定设备与服务的组合,数据格式清晰,便于进一步分析。研究人员可利用这些数据构建机器学习模型,识别智能设备的网络行为特征,或评估隐私保护技术的有效性。使用该数据集时,需引用相关论文以尊重作者的知识产权。
背景与挑战
背景概述
随着物联网技术的迅猛发展,智能家居设备逐渐渗透到人们的日常生活中,然而其安全性问题也日益凸显。由Ahmed Mohamed Hussain、Gabriele Oligeri和Thiemo Voigt等研究人员于2020年创建的《The Dark (and Bright) Side of IoT: Attacks and Countermeasures for Identifying Smart Home Devices and Services Dataset》数据集,旨在揭示智能家居设备及其服务在网络流量中的可识别性,并探索相应的防御措施。该数据集通过采集Amazon Echo、Google Nest Mini等设备的网络流量数据,结合机器学习技术,揭示了加密技术无法完全保护用户隐私的现状。该研究不仅为智能家居设备的安全性提供了新的视角,也为相关领域的隐私保护研究奠定了重要基础。
当前挑战
该数据集的研究挑战主要体现在两个方面。首先,在领域问题层面,智能家居设备的网络流量模式具有高度复杂性,如何从海量数据中准确识别设备及其运行的服务成为一大难题。尽管加密技术被广泛应用,但网络流量本身仍可能暴露设备信息,这使得隐私保护面临严峻挑战。其次,在数据集构建过程中,研究人员需要克服数据采集的复杂性,例如如何在不干扰用户正常使用的情况下捕获设备流量,以及如何确保数据的完整性和代表性。此外,不同设备和服务之间的流量模式差异显著,如何构建统一的模型以应对多样化的场景也是研究中的关键挑战。
常用场景
经典使用场景
该数据集在物联网安全领域具有重要的应用价值,尤其是在智能家居设备和服务的安全研究中。通过捕获和分析智能设备(如Amazon Echo和Google Nest Mini)的网络流量,研究人员能够深入理解这些设备在WiFi环境中的通信模式。数据集中的时间戳和包大小信息为分析设备行为提供了基础,使得研究者能够识别设备及其运行的服务,进而评估潜在的安全威胁。
衍生相关工作
该数据集衍生了一系列经典研究工作,特别是在物联网设备识别和隐私保护领域。例如,基于该数据集的研究提出了Eclipse技术,通过重塑网络流量来防止设备和服务被识别。此外,许多后续研究利用该数据集开发了新的机器学习模型,用于检测和分类智能家居设备及其服务。这些工作不仅验证了数据集的实用性,还推动了物联网安全技术的进一步发展。
数据集最近研究
最新研究方向
随着物联网技术的快速发展,智能家居设备的安全性和隐私保护问题日益凸显。近年来,针对智能家居设备的网络攻击手段不断升级,尤其是基于网络流量模式识别的攻击技术,成为研究热点。该数据集通过收集和分析Amazon Echo、Google Nest Mini等设备的网络流量数据,揭示了设备和服务在网络中的可识别性,为开发有效的防御机制提供了重要依据。当前研究聚焦于利用机器学习技术,进一步优化设备识别算法,并探索如Eclipse等流量重塑技术,以增强用户隐私保护。这些研究不仅推动了智能家居安全领域的技术进步,也为未来物联网设备的隐私保护标准制定提供了理论支持。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务