Network Modeling Datasets

github2024-05-11 更新2024-05-31 收录

下载链接：

https://github.com/knowledgedefinednetworking/NetworkModelingDatasets

下载链接

链接失效反馈

官方服务：

资源简介：

本仓库提供的数据集包含使用OMNet++自定义模拟器生成的样本，涵盖不同的输入拓扑、路由配置和流量模式，每个样本包含模拟得出的相关端到端关键性能指标的精确测量，如源/目的地对的数据包级延迟、抖动和丢失统计。

The dataset provided in this repository includes samples generated using a custom OMNet++ simulator, encompassing various input topologies, routing configurations, and traffic patterns. Each sample contains precise measurements of end-to-end key performance indicators derived from simulations, such as packet-level latency, jitter, and loss statistics for source/destination pairs.

创建时间：

2019-05-14

原始信息汇总

Network Modeling Datasets 概述

数据集目的

本数据集旨在为机器学习（ML）模型提供训练和验证所需的数据，特别是在网络建模领域。数据集包含不同输入拓扑、路由配置和流量模式的样本，以及这些样本中精确测量的端到端关键性能指标（如延迟、抖动和丢失）。

数据集内容

样本特征：包含多种网络拓扑、路由配置和流量模式。
性能指标：每对源/目的地的包级延迟、抖动和丢失的统计数据。

数据集使用

用途：用于设计和训练新的ML网络模型，并评估其性能。
比较基准：通过使用相同的数据集，可以比较不同解决方案的性能。

数据集生成工具

模拟器：使用自定义的OMNet++模拟器生成数据。
详细信息：每个数据集的根目录中提供了使用说明。

贡献者

Albert López Brescó (主要开发者)
José Suárez-Varela
Miquel Ferriol-Galmés
Albert Cabellos-Aparicio
Pere Barlet-Ros

搜集汇总

数据集介绍

构建方式

在构建网络建模数据集时，研究团队采用了基于OMNet++的自定义模拟器BNNetSimulator，该模拟器通过模拟不同的网络拓扑、路由配置和流量模式，生成了包含精确端到端关键性能指标（如延迟、抖动和丢包率）的样本数据。每个样本均详细记录了源节点与目的节点之间的包级延迟、抖动和丢包统计信息，确保了数据集在真实网络场景中的应用价值。

使用方法

使用该数据集时，研究者可以将其用于训练和验证基于神经网络的网络建模算法，通过分析不同网络配置下的性能指标，优化网络操作和优化方案。数据集的详细说明和使用指南可在每个数据集的根目录中找到，用户可根据具体需求选择合适的样本进行实验和分析。

背景与挑战

背景概述

网络建模数据集（Network Modeling Datasets）由Albert López Brescó等研究人员创建，旨在解决未来自动驾驶网络中的高效操作与优化问题。该数据集的核心研究问题在于如何构建轻量级且精确的网络模型，以预测关键性能指标（KPI）如延迟和抖动，从而在有限的成本下实现网络优化。传统分析模型如排队论在复杂配置下难以提供准确估计，而基于数据包级别的仿真虽精确但计算成本过高。因此，机器学习（ML）和神经网络（NN）模型被视为潜在的解决方案，但早期尝试未能满足预期，主要原因在于缺乏公开的网络建模数据集。该数据集通过自定义的OMNet++仿真器生成，包含多种网络拓扑、路由配置和流量模式，旨在为研究人员提供一个标准化的基准，以推动ML在网络建模中的应用。

当前挑战

网络建模数据集面临的主要挑战包括：首先，生成具有精确端到端性能指标的数据集成本高昂，尤其是在需要进行数据包级别仿真的情况下。其次，缺乏公开数据集使得不同研究成果难以进行公平比较。此外，尽管ML模型在理论上具有潜力，但实际应用中仍需克服模型复杂性、计算资源需求以及在复杂网络环境下的泛化能力等问题。最后，如何确保数据集的多样性和代表性，以覆盖各种实际网络场景，也是该领域面临的重要挑战。

常用场景

经典使用场景

Network Modeling Datasets数据集的经典使用场景主要集中在网络优化与自驱动网络的构建中。该数据集通过提供不同网络拓扑、路由配置和流量模式的样本，以及精确的端到端关键性能指标（如延迟、抖动和丢包率）的测量数据，为研究人员训练和验证基于机器学习的网络模型提供了坚实的基础。这些数据集特别适用于开发轻量级且高精度的网络模型，以解决传统分析模型在复杂配置下精度不足的问题。

解决学术问题

该数据集解决了在复杂网络环境下，传统分析模型（如排队理论）无法准确预测关键性能指标（KPI）的问题。通过提供精确的端到端性能指标数据，该数据集使得研究人员能够开发和验证基于机器学习的网络模型，从而在保持较低计算成本的同时，实现对网络性能的精确预测。这对于推动网络优化领域的学术研究具有重要意义，并为未来的自驱动网络提供了理论支持。

实际应用

在实际应用中，Network Modeling Datasets数据集可用于网络运营商优化网络性能，特别是在需要快速响应和低成本操作的场景中。通过训练基于机器学习的网络模型，运营商能够实时预测和调整网络配置，以减少延迟、抖动和丢包率，从而提升用户体验。此外，该数据集还可用于开发网络规划工具，帮助设计更高效和稳定的网络架构。

数据集最近研究