TelecomTS
收藏arXiv2025-10-07 更新2025-11-20 收录
下载链接:
https://hf-mirror.com/datasets/AliMaatouk/TelecomTS
下载链接
链接失效反馈官方服务:
资源简介:
TelecomTS是一个大规模的观测数据集,来源于5G电信网络。该数据集包含超过100万条观测值,涵盖了所有协议层的KPIs。与以往的数据集相比,TelecomTS具有异构性和去匿名化协变量,并提供了完整的可见性和尺度信息,使得下游任务的设计更具意义。此外,TelecomTS还支持一系列下游任务,包括异常检测、根因分析和自然语言问答,旨在解决观测数据领域的问题。
TelecomTS is a large-scale observational dataset derived from 5G telecommunications networks. This dataset contains over one million observational records, covering KPIs across all protocol layers. Compared with previous datasets, TelecomTS features heterogeneity and de-anonymized covariates, and provides complete visibility and scale information, which makes the design of downstream tasks more meaningful. Furthermore, TelecomTS supports a range of downstream tasks including anomaly detection, root cause analysis, and natural language question answering, aiming to address challenges in the observational data domain.
提供机构:
耶鲁大学
创建时间:
2025-10-07
搜集汇总
数据集介绍

构建方式
在可观测性数据稀缺的背景下,TelecomTS通过构建5G通信网络实验环境实现数据采集。该数据集采用实验室部署的独立基站与核心网络架构,在100毫秒采样频率下记录18项关键性能指标,涵盖物理层至网络层多维参数。通过划分不同信号强度区域、模拟用户移动性及网络拥塞场景,并结合受控电磁干扰生成真实异常,同时基于学术文献描述构建十类合成异常事件,形成兼具时空变异性和语义真实性的数据基础。
特点
TelecomTS显著区别于传统时间序列数据集,其核心特征体现在三方面:数据维度上包含整数型、浮点型与分类型异质变量,完整保留指标绝对量纲信息;动态模式上呈现高度零膨胀、随机性强及突变频繁的观测数据特性,突破平稳时序结构的局限;任务支持层面突破单一预测框架,原生集成异常检测、根因分析与多模态问答三大下游任务,其中问答基准融合时序推理与网络语义理解,为复杂系统分析提供立体化评估场景。
使用方法
该数据集支持分层级任务验证:在异常检测任务中,需区分自然波动与真实异常,重点关注模型对突发性模式的泛化能力;根因分析任务要求结合多指标联动特征识别十类预定义异常类型;多模态问答任务则需同步处理数值序列与自然语言问题,实现跨模态语义对齐。使用时应保持原始数据尺度信息,避免归一化操作损失关键量纲特征,并建议采用80%-20%的标准划分策略进行模型训练与验证。
背景与挑战
背景概述
随着复杂系统监控需求的日益增长,可观测性数据作为时间序列分析的重要分支逐渐受到学术界关注。TelecomTS数据集由耶鲁大学研究团队于2025年提出,聚焦5G通信网络环境下的多模态可观测性数据分析。该数据集通过实验室构建的完整5G网络架构,采集了涵盖物理层至应用层的18类关键性能指标,以100毫秒分辨率捕获了超过百万条观测记录。其核心价值在于突破了传统时间序列数据集在可观测性领域的局限性,通过保留协变量的绝对尺度信息与去匿名化处理,为异常检测、根因分析和多模态推理等下游任务提供了真实可靠的基准平台。
当前挑战
在领域问题层面,可观测性数据固有的零膨胀特性与高度随机性对现有模型构成严峻挑战。传统时间序列模型难以区分正常业务波动与真实异常,导致异常检测任务中出现大量误报;多模态推理任务中模型对突发性时序模式与网络语义的关联理解存在显著偏差。在构建过程中,5G网络协议栈的异构性要求同时处理整数型、浮点型与分类型变量,而电磁干扰实验的复现需要精确控制信号发射参数。此外,数据同步过程中因时间戳错位引发的对齐误差,需通过KL散度最小化的直方图匹配技术进行校正,这些因素共同增加了数据集的构建复杂度。
常用场景
经典使用场景
在可观测性数据分析领域,TelecomTS数据集通过其高分辨率5G网络指标,为异常检测任务提供了关键支撑。该数据集捕捉了零膨胀、高随机性的时间序列特征,使得研究人员能够针对突发性网络故障开发鲁棒检测算法,例如通过对比正常流量波动与受控干扰信号下的异常模式,有效识别天线故障或资源分配错误等典型场景。
衍生相关工作
基于TelecomTS的异构特征,衍生出Mantis等融合尺度感知机制的时序分类模型,其通过嵌入均值与标准差信息显著提升检测性能。同时催生了面向多模态问答的基准框架,推动语言模型与时间序列数据的交叉研究,例如在故障工单自动生成、无线网络语义推理等方向产生系列创新成果。
数据集最近研究
最新研究方向
在可观测性数据领域,TelecomTS数据集的发布推动了多模态时间序列分析的前沿探索。该数据集通过融合5G通信网络中的异构协变量与自然语言标注,为异常检测、根因分析和时序问答等任务提供了真实场景下的基准平台。当前研究聚焦于开发能够适应零膨胀、高随机性动态的时序基础模型,尤其强调绝对尺度信息在提升下游任务性能中的关键作用。这一进展正推动可观测性分析从传统预测任务向多模态推理范式转变,为复杂系统运维提供了新的方法论支撑。
相关研究论文
- 1通过耶鲁大学 · 2025年
以上内容由遇见数据集搜集并总结生成



