five

nraptisss/TMF921-intent-to-config-augmented

收藏
Hugging Face2026-04-30 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/nraptisss/TMF921-intent-to-config-augmented
下载链接
链接失效反馈
官方服务:
资源简介:
TMF921意图到配置增强数据集是最大的开放式SFT训练数据集,用于将自然语言网络意图转换为符合规范的5G/6G配置,涵盖6个并发的电信规范层、8个生命周期操作、18个行业垂直领域和对抗性鲁棒性测试。数据集包含41,815个样本(39,294个训练样本/2,521个测试样本),这些样本将自然语言意图与结构化网络配置JSON对象配对,基于真实的电信标准(TMF921、3GPP TS 28.312、ETSI ZSM 009-1、CAMARA、O-RAN A1和3GPP TS 28.541)。该数据集是意图到配置数据集的第三代增强版本,增加了LLM增强的自然语言多样性、扩展的行业和用例覆盖范围以及对抗性样本。

The TMF921 Intent-to-Configuration Augmented Dataset is the largest open SFT training dataset for translating natural language network intents into spec-compliant 5G/6G configurations across 6 concurrent telecom specification layers, with 8 lifecycle operations, 18 industry verticals, and adversarial robustness testing. It includes 41,815 samples (39,294 train / 2,521 test) of natural language intents paired with structured network configuration JSON objects, grounded in real telecom standards (TMF921, 3GPP TS 28.312, ETSI ZSM 009-1, CAMARA, O-RAN A1, and 3GPP TS 28.541). This dataset is the augmented third generation in a lineage of progressively richer intent-to-configuration datasets, adding LLM-augmented natural language diversity, expanded sector and use-case coverage, and adversarial samples.
提供机构:
nraptisss
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集名为TMF921-intent-to-config-augmented,旨在服务于电信网络领域,特别是意图驱动网络配置的机器学习任务。其构建方式基于TMF921标准中的意图模型,通过数据增强技术扩充原始意图到配置的映射样本。数据集中每条样本包含唯一标识符、多轮对话消息序列、目标网络层级、切片类型、业务场景、行业领域以及关键性能指标(如时延、可靠性、上下行吞吐量等)。训练集包含39294条样本,测试集包含2521条样本,以标准化的JSON格式存储,便于模型训练与评估。
特点
该数据集最显著的特点在于其多维度的结构设计,不仅涵盖了意图表达的对话记录,还融合了网络配置所需的各类参数。每个样本均包含具体的服务等级目标(如latency_ms、reliability_pct)以及网络能力指标(如dl_throughput_mbps、ul_throughput_mbps),使得数据能够直接用于意图到配置的端到端学习。此外,数据集引入了slice_type、lifecycle_operation等字段,支持网络切片生命周期管理的多样性学习需求,增强了模型的泛化能力。
使用方法
该数据集适合用于训练和评估基于大语言模型的意图理解与配置生成系统。使用者可通过HuggingFace Datasets库加载default配置下的数据,分别获取train和test两个划分。训练时,可将messages字段中的对话序列作为输入,将sst、sd、lifecycle_operation等字段作为监督标签,构建序列到序列或分类任务。同时,数值型指标可作为回归任务的目标,支持多任务学习框架的搭建,提升模型对复杂网络意图的解析能力。
背景与挑战
背景概述
TMF921-intent-to-config-augmented数据集由电信管理论坛(TM Forum)于近期创建,旨在应对第五代移动通信(5G)网络运营中意图驱动管理与配置生成的复杂需求。该数据集围绕核心研究问题展开:如何将高层业务意图自动转化为可执行的网络配置参数。通过涵盖多个区域、行业用例及网络切片类型(sst/sd)的多样化样本,它涵盖了时延、可靠性、上下行吞吐量等关键性能指标,以及生命周期操作(lifecycle_operation)信息,为意图驱动的网络自动化配置研究提供了宝贵的基准资源,对推动5G网络智能化运维具有重要意义。
当前挑战
该数据集所解决的领域核心挑战在于,5G网络切片与动态配置的复杂性远超传统网络,需要算法学习从用户意图到细粒度参数(如latency_ms、dl_throughput_mbps)的端到端映射。具体挑战包括:1) 意图多样性:文本或结构化意图描述具有高度语义模糊性,需精确解析为专用参数组合;2) 参数依赖:配置参数间存在非线性耦合关系(如时延与可靠性折衷),需建模复杂约束;3) 数据构建:需从真实运维场景提取意图-配置对,面临样本稀疏性及标签一致性验证的困难,以实现高保真数据增强。
常用场景
经典使用场景
在通信网络迈向智能化、自动化的宏大叙事中,TMF921-intent-to-config-augmented数据集扮演着关键角色。该数据集专为意图驱动的网络配置场景而设计,其最经典的用途在于训练AI模型将高层级的用户意图(如‘提升下行吞吐量’)精准地转换为底层的网络配置参数。通过包含SST切片类型、生命周期操作、以及明确的QoS指标(延迟、可靠性、吞吐量等)等特征,它为研究意图感知的自主网络管理提供了标准化的数据基础,是构建‘意图-配置’映射模型的核心资源。
衍生相关工作
自该数据集问世以来,衍生出了一系列意在攻克意图驱动网络管理核心挑战的经典工作。一部分研究聚焦于基于大语言模型(LLM)的意图解析与配置编排,利用该数据集的‘messages’字段(含角色与内容)微调模型,实现自然语言到切片配置的端到端转换。另一部分工作则沿着因果推断与强化学习的路径展开,利用数据集中多维度的QoS指标和配置标签,构建能够推演配置变更效果的‘数字孪生’模型,实现策略的闭环优化。这些衍生工作共同推动了网络领域从‘被动响应’向‘主动预测’的范式转型。
数据集最近研究
最新研究方向
TMF921-intent-to-config-augmented数据集聚焦于电信网络意图驱动配置的转化研究,其丰富字段如延迟、可靠性、吞吐量等映射了网络切片在5G/6G前沿方向的关键性能指标。该数据集通过大规模实例支持将高层业务意图(如用例、区域)转化为底层网络配置参数的深度学习模型训练,紧密关联当前网络自动化与零接触运维(ZTO)的研究热点。其引入的增强数据策略提升了模型泛化能力,对于推动意图驱动网络(IDN)从概念验证走向实际部署具有重要价值,尤其在多领域多云环境下的端到端切片编排中展现出深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作