five

RANalyze-Dataset

收藏
github2026-04-20 更新2026-04-22 收录
下载链接:
https://github.com/wineslab/RANalyzer-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含通过自动化CI/CD/CT管道收集的端到端5G性能测量数据。每个条目捕获了iPerf3下行UDP结果和来自新OAI软件版本触发的空中测试的OpenAirInterface (OAI) gNB日志。数据集涵盖了69个OAI版本和从2023年7月到2025年12月收集的超过9,400次自动化测试运行。

This dataset contains end-to-end 5G performance measurement data collected via automated CI/CD/CT pipelines. Each entry captures downlink UDP test results from iPerf3 and OpenAirInterface (OAI) gNB logs from over-the-air tests triggered by new OAI software versions. The dataset covers 69 OAI versions and over 9,400 automated test runs collected from July 2023 to December 2025.
创建时间:
2026-04-20
原始信息汇总

RANalyzer数据集概述

数据集基本信息

  • 数据集名称:RANalyzer-Dataset
  • 数据来源:通过自动化CI/CD/CT管道收集的端到端5G性能测量数据。
  • 时间跨度:2023年11月至2025年12月。
  • 测试运行总数:9,430次。
  • 关联论文:R. Shirkhani, R. Prasad, L. Bonati, T. Melodia, and M. Polese, "RANalyzer: Automated Continuous RAN Software Evaluation and Regression Analysis," in Proc. of IEEE International Conference on Network Softwarization (NetSoft), Berlin, Germany, July 2026.

实验设置

  • 网络测试平台:部署在OpenShift集群上的异构私有5G网络测试平台,集成了开源和商业组件。
  • 计算与无线接入网:RAN托管在配备AMD EPYC 7262处理器的Microway服务器上。
  • 无线电与用户设备:使用USRP X410软件定义无线电网格进行空中测试,工作在3.629 GHz(n78频段)的60 MHz信道。用户设备为连接到小型主机计算节点的商用Sierra Wireless 5G调制解调器。
  • 核心网:使用Open5GS作为5G核心网。
  • CI/CD/CT管道:数据收集由5G-CT框架驱动,该框架实现自动化管道,每周构建新标签、部署并测试端到端网络。
  • 测试内容:每次端到端测试使用iPerf3,以多个目标数据速率(例如10、20、30 Mbps,最高至80 Mbps)运行下行UDP流量。每次测试结束后,存储gNB日志、iPerf3结果和UE元数据。

数据集结构

数据集根目录为 cicd-dataset-ocp-arena/,按测试运行日期(YYYYMMDD/)和时间(HHMMSS/,UTC)组织。每个测试运行目录包含以下文件:

  • YYYYMMDD_HHMMSS_<id>.json
  • YYYYMMDD_HHMMSS_<id>_udp_band<X>Mbps_time_stats.csv
  • nr-gnb.log

其中,<id> 是分配给每次测试运行的唯一数字标识符,<X> 是目标比特率(单位:Mbps)。

文件描述

YYYYMMDD_HHMMSS_<id>.json

  • 格式:JSON。
  • 内容:从UE/客户端捕获的原始iPerf3结果。
  • 包含信息:连接元数据、每个间隔的吞吐量、抖动、丢包和字节数、完整测试持续时间的聚合摘要统计信息、主机和远程端点的CPU利用率。

YYYYMMDD_HHMMSS_<id>_udp_band<X>Mbps_time_stats.csv

  • 格式:CSV。
  • 内容:iPerf3测试的时间序列细分,通常为10秒测试内每秒间隔一行。
  • 主要列:间隔开始/结束时间、实际间隔持续时间、传输字节数、吞吐量(bps)、抖动(ms)、丢失/总数据包、丢包率(%)、主机和远程CPU使用率、目标比特率(Mbps)、测试日期和时间标识符。

nr-gnb.log

  • 格式:日志文件。
  • 内容:测试运行的完整OAI gNB日志。
  • 包含信息:多层事件,包括随机接入过程消息、RRC建立、PDU会话建立、每TTI信号质量指标(RSRP、SNR、BLER、MCS)、HARQ重传计数以及MAC/RLC字节计数器。

已处理数据集

  • 文件processed-dataset.csv(位于父目录中)。
  • 格式:CSV。
  • 内容:数据集的已处理、特征提取版本。每行对应一次由 log_id(格式:YYYYMMDD_HHMMSS)标识的测试运行,包含聚合的iPerf3指标、gNB信号质量和协议事件特征。
搜集汇总
数据集介绍
main_image_url
构建方式
在5G网络研究领域,自动化测试与持续集成已成为评估无线接入网软件性能的关键手段。RANalyze-Dataset的构建依托于一个异构私有5G网络测试平台,该平台部署于OpenShift容器集群,并集成了开源与商业组件以实现端到端网络功能。数据采集通过5G-CT框架驱动的自动化CI/CD/CT流水线完成,每周构建新的软件标签并执行测试,确保在持续更新gNB软件的同时保持测试的可重复性。每次测试均运行下行UDP流量,使用iPerf3工具在多种目标比特率下进行性能测量,并同步记录gNB日志、iPerf3结果及用户设备元数据,从而形成涵盖超过9400次测试运行的结构化数据集。
特点
该数据集的核心特点在于其全面性与自动化生成机制。时间跨度从2023年11月至2025年12月,覆盖69个OpenAirInterface软件版本,提供了丰富的时序性能数据。数据集不仅包含原始的iPerf3 JSON结果与gNB日志,还提供了按时间间隔细分的CSV文件,详细记录了吞吐量、抖动、丢包率及CPU利用率等指标。此外,数据集附带了经过特征提取的聚合版本,将每次测试运行的信号质量指标与协议事件特征整合为结构化表格,便于直接用于机器学习或统计分析。这种多层次的数据组织形式,为研究5G网络性能演变与软件回归分析提供了坚实基础。
使用方法
研究人员可利用该数据集深入探究5G无线接入网软件的持续集成与性能评估。数据集按日期与时间层级组织,用户可通过解析特定测试运行的JSON与CSV文件,获取详细的网络性能时序数据。对于宏观分析,可直接使用预处理的CSV文件,其中已聚合了每次测试的关键指标,如平均吞吐量、信号质量参数及协议事件计数。数据集适用于多种应用场景,包括但不限于网络性能建模、软件版本回归检测、无线信道特性分析以及自动化测试框架的验证。通过结合gNB日志中的层间事件与iPerf3测量结果,能够实现对端到端网络行为的综合评估。
背景与挑战
背景概述
随着第五代移动通信技术的演进,无线接入网软件的持续集成与测试成为保障网络性能稳定的关键环节。RANalyze数据集由Northeastern University的研究团队于2026年IEEE NetSoft会议上首次提出,旨在通过自动化CI/CD/CT流水线,系统性地收集端到端5G性能测量数据。该数据集涵盖了从2023年7月至2025年12月期间,基于69个OpenAirInterface软件版本、超过9400次自动化测试运行的结果,核心研究问题聚焦于RAN软件更新的回归分析与性能评估,为开源5G网络系统的质量保障提供了实证基础,推动了网络软体化领域的标准化测试方法论发展。
当前挑战
在无线接入网性能评估领域,传统方法难以应对软件快速迭代带来的回归测试复杂性,RANalyze数据集致力于解决自动化、可重复的端到端5G性能基准测试难题。其构建过程面临多重挑战:首先,在异构私有测试平台上集成开源与商用组件,需确保跨软件版本的测试环境一致性;其次,通过空中接口收集的gNB日志与iPerf3指标,涉及海量时序数据的同步与清洗;此外,维持长达两年的连续测试流水线,需克服硬件故障、射频干扰与软件兼容性等工程障碍,以实现高可靠性的性能数据采集。
常用场景
经典使用场景
在5G无线接入网(RAN)软件演进与性能评估领域,RANalyze-Dataset为研究人员提供了一个宝贵的实证分析平台。该数据集通过自动化CI/CD/CT管道收集了超过9,400次端到端5G性能测量,涵盖iPerf3下行UDP测试结果与OpenAirInterface gNB日志。其经典使用场景集中于对RAN软件版本更新进行连续的回归测试与性能分析,例如评估不同OAI软件版本在真实无线环境下的吞吐量、时延、丢包率等关键性能指标的变化趋势,从而揭示软件迭代对网络质量的影响。
衍生相关工作
围绕RANalyze-Dataset,已衍生出一系列重要的研究工作。其伴随论文《RANalyzer: Automated Continuous RAN Software Evaluation and Regression Analysis》提出了一个自动化RAN软件评估与回归分析框架,是该数据集最直接的理论与实践成果。此外,数据集所依托的5G-CT框架以及AutoRAN等前期工作,共同构成了一个面向持续集成与测试的5G网络研究生态系统,激励了后续在基于机器学习的RAN异常检测、性能根因分析以及网络配置优化等方向上的探索。
数据集最近研究
最新研究方向
在5G网络软件化与自动化测试领域,RANalyze-Dataset凭借其从持续集成/交付/测试管道中获取的大规模端到端性能测量数据,正推动无线接入网络(RAN)智能运维的前沿探索。该数据集紧密关联开源RAN软件(如OpenAirInterface)的快速迭代与质量保障需求,为自动化回归分析、性能异常检测及软件缺陷定位提供了关键实证基础。研究热点集中于利用机器学习方法分析时序日志与流量指标,以预测软件版本更新对网络KPI(如吞吐量、时延、丢包率)的影响,从而支撑RAN软硬件的持续优化与稳定部署,对提升5G网络可靠性及降低运维成本具有重要实践意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作