Chorus-outage
收藏Hugging Face2025-05-26 更新2025-05-27 收录
下载链接:
https://huggingface.co/datasets/cloudy-sfu/Chorus-outage
下载链接
链接失效反馈官方服务:
资源简介:
该数据集记录了新西兰最大的互联网光纤提供商chorus网站的历史互联网中断情况。数据详细记录了中断的开始时间、事件点位置、受影响区域、受影响服务数量、事件描述、最新更新时间和更新内容等信息。
创建时间:
2025-05-25
原始信息汇总
数据集概述
基本信息
- 数据集名称: Chorus-outage
- 许可证: CC0 1.0
- 数据来源: chorus
数据集描述
- 内容: 记录新西兰最大互联网光纤提供商"chorus"的历史互联网中断情况。
- 覆盖范围: 主要服务于新西兰的ADSL、VDSL和光纤互联网连接。
数据组织
- 命名规则:
- 文件夹格式
YYYY-MM包含该年该月的数据。 - 文件格式
YYYY-MM-DD表示UTC时间约10:00时的互联网中断状态(脚本触发时间可能有约10分钟延迟)。
- 文件夹格式
数据解析
- 解析脚本示例: python import pandas as pd outage = pd.read_pickle("2025-04/2025-04-20")
数据列说明
| 列名 | 数据类型 | 描述 |
|---|---|---|
start_time |
pandas.Timestamp |
中断开始时间。 |
incident_point |
shapely.Point |
中断事件在地图上的标注位置。 |
incident_area |
shapely.MultiPolygon |
无法访问互联网的区域。 |
role |
str |
未知。 |
n_impacted_services |
int |
受影响的互联网服务数量。 |
description |
str |
描述信息。 |
update_time |
pandas.Timestamp |
关于该事件的最新更新的发布时间。 |
update_text |
str |
关于该事件的最新更新的内容。 |
注意事项
- 由于表中包含
shapely对象,未提供文本格式。
搜集汇总
数据集介绍

构建方式
在互联网服务监测领域,Chorus-outage数据集通过自动化脚本定期采集新西兰最大光纤网络提供商Chorus的实时中断地图数据。该数据集以UTC时间每日10:00为基准点进行快照式记录,文件按年月目录分级存储,每个Parquet文件包含特定日期的完整中断事件信息,时间戳误差控制在10分钟以内。数据采集过程严格遵循网络服务状态的可视化呈现逻辑,通过解析GeoJSON格式的地理空间数据与时间序列指标,构建起多维度的网络中断档案。
特点
该数据集的核心价值体现在其独特的新西兰全域网络中断监测视角,完整覆盖ADSL/VDSL/光纤等多种接入方式。数据字段设计兼具工程实用性与地理信息维度,其中incident_point与incident_area字段采用标准化GeoJSON格式,可无缝对接地理信息系统分析。时间维度上包含事件起始时间、更新时间的精确记录,并量化记录受影响服务数量,为网络韧性研究提供连续时空观测样本。这种多模态数据结构既支持微观层面的故障定位,也满足宏观趋势分析需求。
使用方法
研究人员可通过Python生态中的pandas库直接读取Parquet格式数据文件,利用shapely.geometry.shape()函数解析地理空间坐标。典型分析流程包括时序异常检测——通过start_time与update_time字段追踪中断持续时间规律,结合n_impacted_services字段评估事件影响规模。地理空间分析可基于incident_area字段绘制服务中断热力图,而description与update_text文本字段则适用于自然语言处理驱动的故障原因归类。这种结构化与非结构化数据的融合,为通信网络可靠性研究提供了标准化分析框架。
背景与挑战
背景概述
Chorus-outage数据集聚焦于新西兰互联网服务中断的历史记录,由该国最大的光纤网络提供商Chorus创建并维护。该数据集自2025年起系统性地采集网络故障信息,旨在为网络可靠性研究提供实证基础。其核心研究问题涉及大规模网络基础设施的稳定性监测与故障模式分析,对电信运营管理、关键基础设施韧性评估以及应急响应策略优化具有重要参考价值。
当前挑战
该数据集需应对网络中断动态监测中的多重挑战:一方面需解决故障影响范围的空间量化难题,如通过GeoJSON精确刻画受影响区域;另一方面在构建过程中面临实时数据采集的时效性约束,例如脚本触发存在约10分钟延迟。此外,异构数据融合(如时空信息与文本描述的整合)以及故障分类标准的一致性维护,均为数据质量控制的关键难点。
常用场景
经典使用场景
在互联网基础设施监测领域,Chorus-outage数据集为研究者提供了新西兰主要网络服务商的历史中断记录,其经典使用场景包括分析网络故障的时空分布模式。通过解析GeoJSON格式的地理信息与时间戳数据,学者能够识别高频中断区域及季节性波动规律,为网络韧性评估奠定数据基础。
解决学术问题
该数据集有效解决了网络可靠性量化研究的核心难题,通过标准化的中断事件记录框架,支持对基础设施脆弱性的实证分析。其精确的受影响服务数量与地理范围标注,为构建网络中断传播模型提供了关键参数,推动了通信工程与危机管理学科的交叉研究进展。
衍生相关工作
基于该数据集的时空特性,已有研究衍生出多维度中断预测模型,如结合气象数据的网络风险预警系统。相关经典工作还包括开发开源分析工具链,实现从原始Parquet文件到交互式可视化看板的端到端处理流程,显著降低了网络地理数据分析的技术门槛。
以上内容由遇见数据集搜集并总结生成



