US-PowerOutages-weekly-sum
收藏Hugging Face2025-04-25 更新2025-04-26 收录
下载链接:
https://huggingface.co/datasets/mhdaw/US-PowerOutages-weekly-sum
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含美国各州和县在各种天气事件下特征的详细数据集,包括但不限于天文低潮、雪崩、暴风雪、海岸洪水、寒风/风寒、碎屑流、浓雾等事件的计数。数据集还包含了温度、降水量、降雪量等天气相关数据,以及时间戳、地理位置和严重程度等信息。数据集分为训练集、验证集和测试集,可用于天气事件的预测和分析。
创建时间:
2025-04-25
搜集汇总
数据集介绍

构建方式
该数据集聚焦于美国电力中断事件的时空分布特征,通过整合多源异构数据构建而成。核心数据来源于美国各州电力公司的周报统计,采用FIPS编码实现地理信息标准化,并融合了美国国家海洋和大气管理局的极端天气事件分类数据。时间维度上采用时间戳精确到纳秒级别,同时通过气象观测数据补充温度、降水等环境变量,构建起覆盖全美县级行政区的多维度时空数据集。
特点
数据集最显著的特征在于其精细的事件分类体系,包含54种极端天气事件类型计数变量,从天文低潮到火山灰沉降均有覆盖。时空维度上提供周粒度聚合数据,并附带气温极值、风速等连续型气象指标。数据结构上采用分层存储策略,包含75万训练样本和31万测试样本,确保模型验证的可靠性。各字段数据类型经过优化设计,针对不同事件类型采用int8到float64的差异化精度存储。
使用方法
该数据集适用于时空预测模型的训练与验证,建议使用时注意数据的时间自相关性。建模时可结合FIPS编码实现地理空间分析,利用weather_source字段区分气象数据来源。对于分类任务,建议将54种天气事件计数转化为多标签分类目标;回归任务则可聚焦customers_out字段预测受影响用户数。数据集已预置train-validation-test划分,可直接用于监督学习任务,但需注意不同区域数据分布的差异性。
背景与挑战
背景概述
US-PowerOutages-weekly-sum数据集聚焦于美国电力中断事件的系统性记录与分析,由专业研究机构整合多源数据构建而成。该数据集以县级行政区划为基本单元,详细记录了2010年代后期至2020年代初期的电力中断事件及其相关气象特征,涵盖47种自然灾害类型与6种气象参数。其核心价值在于建立了电力基础设施脆弱性与极端气候事件的关联模型,为能源韧性研究提供了重要的实证基础。数据集的时空粒度和多维度特征使其成为气候变化适应策略评估的关键工具,推动了电力系统可靠性研究的定量化发展。
当前挑战
该数据集面临的主要挑战体现在两个维度:在领域问题层面,电力中断事件的归因分析存在高度复杂性,多种自然灾害的耦合效应导致单一因素解释力不足;不同区域电力基础设施的异构性使得标准化评估面临困难。在数据构建层面,原始数据存在显著的时空不均衡问题,偏远地区记录完整性不足;多源气象数据的精度差异需要进行复杂的归一化处理;部分灾害事件分类体系存在交叉重叠,需建立精确的映射规则。这些挑战对数据清洗和特征工程提出了极高要求。
常用场景
经典使用场景
US-PowerOutages-weekly-sum数据集在电力系统可靠性研究中具有重要价值,其详细记录了美国各县每周因自然灾害导致的停电事件及受影响用户数。研究人员通过分析不同自然灾害类型与停电规模之间的关联性,能够深入理解极端天气对电力基础设施的破坏模式。该数据集特别适合用于构建电力系统脆弱性评估模型,为电网抗灾能力提升提供数据支撑。
实际应用
电力公司利用该数据集开发了故障预警系统,通过实时监测气象条件与历史中断模式的匹配度,提前部署应急抢修资源。政府部门则基于数据集的空间分布特征,优化了灾后电力恢复的优先级策略。这些应用显著提升了美国电网在飓风、冰暴等极端天气事件中的响应效率。
衍生相关工作
该数据集催生了多项开创性研究,包括基于机器学习的停电规模预测算法、考虑气候变化的电网长期规划模型等。IEEE Transactions on Power Systems刊载的《Multi-hazard Resilience Assessment Framework》便是利用该数据集构建的经典框架,其创新性地将53种灾害类型纳入统一评估体系。
以上内容由遇见数据集搜集并总结生成



