Network Modeling Datasets
收藏github2024-05-11 更新2024-05-31 收录
下载链接:
https://github.com/knowledgedefinednetworking/NetworkModelingDatasets
下载链接
链接失效反馈官方服务:
资源简介:
本仓库提供的数据集包含使用OMNet++自定义模拟器生成的样本,涵盖不同的输入拓扑、路由配置和流量模式,每个样本包含模拟得出的相关端到端关键性能指标的精确测量,如源/目的地对的数据包级延迟、抖动和丢失统计。
The dataset provided in this repository includes samples generated using a custom OMNet++ simulator, encompassing various input topologies, routing configurations, and traffic patterns. Each sample contains precise measurements of end-to-end key performance indicators derived from simulations, such as packet-level latency, jitter, and loss statistics for source/destination pairs.
创建时间:
2019-05-14
原始信息汇总
Network Modeling Datasets 概述
数据集目的
本数据集旨在为机器学习(ML)模型提供训练和验证所需的数据,特别是在网络建模领域。数据集包含不同输入拓扑、路由配置和流量模式的样本,以及这些样本中精确测量的端到端关键性能指标(如延迟、抖动和丢失)。
数据集内容
- 样本特征:包含多种网络拓扑、路由配置和流量模式。
- 性能指标:每对源/目的地的包级延迟、抖动和丢失的统计数据。
数据集使用
- 用途:用于设计和训练新的ML网络模型,并评估其性能。
- 比较基准:通过使用相同的数据集,可以比较不同解决方案的性能。
数据集生成工具
- 模拟器:使用自定义的OMNet++模拟器生成数据。
- 详细信息:每个数据集的根目录中提供了使用说明。
贡献者
- Albert López Brescó (主要开发者)
- José Suárez-Varela
- Miquel Ferriol-Galmés
- Albert Cabellos-Aparicio
- Pere Barlet-Ros
搜集汇总
数据集介绍

构建方式
在构建网络建模数据集时,研究团队采用了基于OMNet++的自定义模拟器BNNetSimulator,该模拟器通过模拟不同的网络拓扑、路由配置和流量模式,生成了包含精确端到端关键性能指标(如延迟、抖动和丢包率)的样本数据。每个样本均详细记录了源节点与目的节点之间的包级延迟、抖动和丢包统计信息,确保了数据集在真实网络场景中的应用价值。
使用方法
使用该数据集时,研究者可以将其用于训练和验证基于神经网络的网络建模算法,通过分析不同网络配置下的性能指标,优化网络操作和优化方案。数据集的详细说明和使用指南可在每个数据集的根目录中找到,用户可根据具体需求选择合适的样本进行实验和分析。
背景与挑战
背景概述
网络建模数据集(Network Modeling Datasets)由Albert López Brescó等研究人员创建,旨在解决未来自动驾驶网络中的高效操作与优化问题。该数据集的核心研究问题在于如何构建轻量级且精确的网络模型,以预测关键性能指标(KPI)如延迟和抖动,从而在有限的成本下实现网络优化。传统分析模型如排队论在复杂配置下难以提供准确估计,而基于数据包级别的仿真虽精确但计算成本过高。因此,机器学习(ML)和神经网络(NN)模型被视为潜在的解决方案,但早期尝试未能满足预期,主要原因在于缺乏公开的网络建模数据集。该数据集通过自定义的OMNet++仿真器生成,包含多种网络拓扑、路由配置和流量模式,旨在为研究人员提供一个标准化的基准,以推动ML在网络建模中的应用。
当前挑战
网络建模数据集面临的主要挑战包括:首先,生成具有精确端到端性能指标的数据集成本高昂,尤其是在需要进行数据包级别仿真的情况下。其次,缺乏公开数据集使得不同研究成果难以进行公平比较。此外,尽管ML模型在理论上具有潜力,但实际应用中仍需克服模型复杂性、计算资源需求以及在复杂网络环境下的泛化能力等问题。最后,如何确保数据集的多样性和代表性,以覆盖各种实际网络场景,也是该领域面临的重要挑战。
常用场景
经典使用场景
Network Modeling Datasets数据集的经典使用场景主要集中在网络优化与自驱动网络的构建中。该数据集通过提供不同网络拓扑、路由配置和流量模式的样本,以及精确的端到端关键性能指标(如延迟、抖动和丢包率)的测量数据,为研究人员训练和验证基于机器学习的网络模型提供了坚实的基础。这些数据集特别适用于开发轻量级且高精度的网络模型,以解决传统分析模型在复杂配置下精度不足的问题。
解决学术问题
该数据集解决了在复杂网络环境下,传统分析模型(如排队理论)无法准确预测关键性能指标(KPI)的问题。通过提供精确的端到端性能指标数据,该数据集使得研究人员能够开发和验证基于机器学习的网络模型,从而在保持较低计算成本的同时,实现对网络性能的精确预测。这对于推动网络优化领域的学术研究具有重要意义,并为未来的自驱动网络提供了理论支持。
实际应用
在实际应用中,Network Modeling Datasets数据集可用于网络运营商优化网络性能,特别是在需要快速响应和低成本操作的场景中。通过训练基于机器学习的网络模型,运营商能够实时预测和调整网络配置,以减少延迟、抖动和丢包率,从而提升用户体验。此外,该数据集还可用于开发网络规划工具,帮助设计更高效和稳定的网络架构。
数据集最近研究
最新研究方向
在网络建模领域,随着未来自动驾驶网络的快速发展,构建高效且优化的网络操作解决方案成为研究的核心。当前,网络运营商面临的主要挑战在于缺乏能够在复杂配置下进行精确预测的网络模型,尤其是在处理端到端的关键性能指标(如延迟、抖动等)时。传统的分析模型(如排队论)在实际应用中难以达到高精度,而基于数据包级别的仿真虽然精确,但计算成本过高,不适用于短期网络操作。因此,机器学习(ML)尤其是神经网络(NN)模型,因其轻量级和高精度的潜力,逐渐成为研究的热点。然而,ML模型的成功应用依赖于高质量的公开数据集,这些数据集不仅用于训练和验证模型,还为新解决方案的基准测试提供了基础。本数据集的发布,旨在填补这一空白,通过提供包含不同拓扑结构、路由配置和流量模式的样本,以及精确的端到端性能指标,推动ML在网络建模中的应用,并为研究者提供一个统一的基准,以便比较和评估不同模型的性能。
以上内容由遇见数据集搜集并总结生成



