Gotham Dataset 2025
收藏arXiv2025-02-05 更新2025-02-11 收录
下载链接:
https://zenodo.org/records/14502760
下载链接
链接失效反馈官方服务:
资源简介:
Gotham Dataset 2025是一个大规模物联网网络数据集,由卡迪夫大学等机构创建。该数据集通过Gotham测试床生成,包含78个模拟的物联网设备,支持多种协议。数据集包括正常和恶意网络流量,适用于入侵检测系统和网络安全机制的研究。
Gotham Dataset 2025 is a large-scale Internet of Things (IoT) network dataset developed by institutions including Cardiff University. It is generated via the Gotham testbed, and encompasses 78 simulated IoT devices that support multiple network protocols. The dataset contains both benign and malicious network traffic, making it suitable for research on intrusion detection systems and cybersecurity mechanisms.
提供机构:
卡迪夫大学计算机科学与信息学院
创建时间:
2025-02-05
搜集汇总
数据集介绍

构建方式
Gotham Dataset 2025 是通过使用 Gotham 测试平台构建的。该平台是一个模拟的大规模物联网(IoT)网络,旨在为网络安全研究提供一个真实且异构的环境。测试平台包括 78 个模拟的 IoT 设备,运行各种协议,包括 MQTT、CoAP 和 RTSP。网络流量使用 tcpdump 以 Packet Capture(PCAP)格式捕获,并记录了良性流量和恶意流量。恶意流量是通过脚本攻击生成的,包括多种攻击类型,如拒绝服务(DoS)、Telnet 暴力破解、网络扫描、CoAP 放大和命令与控制(C&C)通信的不同阶段。随后,使用 Python 和 Tshark 工具对数据进行特征提取,并将结果数据转换为逗号分隔值(CSV)格式并标记。
特点
Gotham Dataset 2025 的特点在于其多样化的流量模式和攻击场景。该数据集提供了大规模物联网网络环境中入侵检测系统和安全机制开发的有价值资源。此外,该数据集采用了分布式数据收集和组织方法,其中每个 IoT 设备的网络流量在 IoT 网关和设备之间的接口处单独捕获。这使得该数据集适用于研究物联网环境中的分布式学习技术,如联邦学习(FL)。此外,该数据集是完全可重复和可扩展的,因为它依赖于开源的 Gotham 测试平台。
使用方法
Gotham Dataset 2025 的使用方法包括从 Zenodo 仓库下载原始网络流量和标记数据,然后使用 Python 脚本进行处理和特征提取。研究人员可以使用这些数据来开发针对大规模物联网网络的入侵检测系统和防御机制。此外,该数据集还提供了 Jupyter Notebook,演示了如何使用该数据集进行数据加载、预处理和模型训练。
背景与挑战
背景概述
随着物联网(IoT)技术的飞速发展,大规模物联网网络的安全研究变得日益重要。现有的物联网网络安全数据集往往规模有限,且缺乏多样性,难以准确代表大规模物联网网络的复杂性。为了解决这一难题,研究人员Othmane Belarbi、Theodoros Spyridopoulos等利用Gotham测试床,构建了一个名为Gotham Dataset 2025的大规模物联网网络数据集。该数据集通过模拟真实且异构的环境,为网络安全研究提供了宝贵的资源。数据集包括78个模拟物联网设备,运行多种协议,如MQTT、CoAP和RTSP。数据集包含了正常和恶意流量,并记录了多种攻击类型,如拒绝服务(DoS)、Telnet暴力破解、网络扫描、CoAP放大攻击以及命令和控制(C&C)通信的不同阶段。Gotham Dataset 2025对物联网网络安全领域的研究产生了重要影响,为开发入侵检测系统和安全机制提供了现实的基础。
当前挑战
Gotham Dataset 2025在解决物联网网络安全领域问题方面面临着一些挑战。首先,构建大规模物联网网络数据集的挑战在于如何模拟真实环境中的多样性和复杂性。其次,在数据集构建过程中,需要解决如何有效地捕捉和分析物联网设备之间的大量流量。此外,数据集的标签准确性也是一个挑战,需要确保能够准确地区分正常和恶意流量。最后,随着物联网设备的不断更新和攻击技术的发展,数据集的时效性和适用性也需要不断更新和扩展。
常用场景
经典使用场景
Gotham Dataset 2025作为一个大规模物联网网络数据集,被广泛应用于入侵检测和安全研究。该数据集模拟了一个真实的物联网环境,包含78个模拟的物联网设备,运行在不同的协议上,如MQTT、CoAP和RTSP。通过使用tcpdump捕获网络流量,并记录良性流量和恶意流量,包括DoS攻击、Telnet暴力破解、网络扫描、CoAP放大攻击和C&C通信的不同阶段。该数据集的CSV格式数据经过Python处理,使用Tshark工具提取特征,并进行了标注。这些数据为研究者和开发人员提供了宝贵的资源,用于开发针对复杂、大规模物联网环境的入侵检测系统和安全机制。
衍生相关工作
Gotham Dataset 2025衍生了多项相关研究工作。例如,研究人员利用该数据集评估了在联邦学习环境中训练的深度神经网络(DNN)的入侵检测性能。结果表明,DNN在处理大规模和异构数据集方面表现出色,能够有效地区分良性流量和恶意流量。此外,该数据集还被用于研究分布式学习技术在物联网环境中的应用,以及开发针对物联网设备的定制安全机制。这些相关研究工作进一步扩展了Gotham Dataset 2025的应用范围,并为物联网安全研究提供了新的思路和方法。
数据集最近研究
最新研究方向
针对物联网(IoT)网络安全的深入研究,Gotham Dataset 2025 提供了一个大规模、异构的 IoT 网络环境,模拟了现实世界中的攻击场景和正常流量。该数据集的最新研究方向主要集中在分布式学习,特别是联邦学习(FL)技术,以解决数据隐私和安全性问题。研究人员利用 Gotham Dataset 2025 开发入侵检测系统(IDS),并探索在大型 IoT 网络环境中定制安全机制的复杂性。此外,该数据集还促进了针对多样化设备行为、流量模式和攻击场景的入侵检测系统和防御机制的开发。通过提供真实的 IoT 网络环境,Gotham Dataset 2025 为研究人员提供了宝贵的资源,以推动物联网安全领域的前沿研究。
相关研究论文
- 1Gotham Dataset 2025: A Reproducible Large-Scale IoT Network Dataset for Intrusion Detection and Security Research卡迪夫大学计算机科学与信息学院 · 2025年
以上内容由遇见数据集搜集并总结生成



