five

ca_power_outages

收藏
Hugging Face2025-11-15 更新2025-11-16 收录
下载链接:
https://huggingface.co/datasets/shourya01/ca_power_outages
下载链接
链接失效反馈
官方服务:
资源简介:
California Outage & Weather Dataset 是一个包含2019年1月1日至2020年12月31日加州58个县(FIPS代码`06001`至`06115`)的电力中断和气象数据集。数据集以15分钟的时间分辨率提供,共有70,176个时间戳。数据集包含县级别的电力中断计数、数据可用性掩码和24个ERA5衍生的气象特征。该数据集旨在方便对电力中断和气象驱动因素进行联合建模。
创建时间:
2025-11-08
原始信息汇总

California Power Outages 数据集概述

数据集基本信息

  • 许可证: MIT
  • 标签: 气候
  • 数据集名称: California Power Outages
  • 数据规模: 10万<n<100万
  • 文件格式: NetCDF

时间与空间覆盖范围

  • 时间范围: 2019年1月1日 - 2020年12月31日
  • 时间分辨率: 15分钟(共70,176个时间戳)
  • 空间范围: 加利福尼亚州58个县(FIPS代码06001-06115)

数据内容

主要数据变量

  • tracked: 数据可用性标志(1表示真实观测,0表示零填充)
  • out: 各县估计的客户停电次数
  • weather: 24个ERA5衍生的天气特征

天气特征列表

blh, cape, d2m, gust, hcc, ishf, lcc, lsm, max_10si, mcc, pres, pwat, sdlwrf, sdswrf, slhtf, sp, sulwrf, suswrf, t2m, tcc, tcolw, tp, u10, v10

数据来源与处理

  • 停电数据: 源自橡树岭国家实验室的EAGLE-I数据集
  • 天气数据: 来自ARCO-ERA5公共Zarr档案
  • 数据处理: 天气数据从每小时分辨率插值到15分钟分辨率以匹配停电观测节奏

数据文件

  • 主文件: california.nc(约1GB)
  • 聚合文件: california_hourly.nc(按1小时网格聚合,停电数据求和,天气数据平均)

使用示例

python import xarray as xr

ds = xr.open_dataset("california.nc") out_san_diego = ds["out"].sel(location="06073") weather_subset = ds["weather"].sel(location="06073", feature=["t2m", "tp"])

搜集汇总
数据集介绍
main_image_url
构建方式
在电力系统与气候科学交叉领域,该数据集通过多源数据融合技术构建而成。其核心电力中断数据源自橡树岭国家实验室开发的EAGLE-I数据库,记录了2019至2020年间加利福尼亚州58个郡的用电中断情况。气象要素则从欧洲中期天气预报中心的ERA5再分析资料中提取,通过空间插值方法将24种大气变量关联至各郡地理中心,并采用时间降尺度技术将原始小时数据转换为与电力中断记录同步的15分钟分辨率,最终形成统一时空框架的多元观测矩阵。
特点
本数据集最显著的特征在于其高时空分辨率的观测结构,以15分钟为间隔持续记录两年周期,形成包含7万余时间戳的连续序列。数据架构采用NetCDF标准格式,通过坐标维度实现电力中断与气象要素的天然对齐,其中location维度对应郡级行政单元,feature维度容纳边界层高度、对流有效位能等24种完备气象变量。特别设计的tracked变量有效标识原始观测与零填充数据,确保模型训练的可靠性,而每小时聚合版本则提供不同时间尺度的分析灵活性。
使用方法
基于xarray库的数据接口设计使得数据分析流程极为简捷,用户可通过坐标选择机制精准提取特定郡县的电力中断序列与气象要素组合。以圣迭戈郡为例,使用location参数'06073'即可获取该地区全部观测记录,配合feature参数筛选地表温度与降水等关键变量。数据集内建的时空对齐特性允许研究人员直接基于共享的timestamp维度构建联合模型,无需额外进行数据预处理即可开展电力系统韧性分析与气候风险建模。
背景与挑战
背景概述
随着气候变化对能源基础设施影响的日益凸显,2019年至2020年间由美国橡树岭国家实验室主导构建的加州电力中断数据集应运而生。该数据集聚焦极端气象条件与区域供电稳定性的关联机制,通过融合EAGLE-I停电统计与ERA5再分析气象数据,实现了58个郡县在15分钟粒度上的多变量同步观测。其创新性地将边界层高度、对流有效位能等24种大气参数与用户停电数量进行空间对齐,为气候韧性电网研究提供了高分辨率基准数据,显著推动了能源地理学与灾害气象学的交叉研究进展。
当前挑战
在电力系统韧性评估领域,该数据集需解决气象要素与停电事件非线性耦合的建模难题,包括极端天气时空异质性对区域电网的差异化影响。数据构建过程中面临多源异构数据的融合挑战:EAGLE-I原始停电记录的缺失值填补需要设计时空插值策略,而ERA5气象数据从小时级到15分钟尺度的降尺度过程中,需保持大气物理参数的一致性。此外,郡县行政边界与气象网格的空间匹配精度、高频时序数据的存储优化等工程问题也构成了重要技术壁垒。
常用场景
经典使用场景
在气候与能源交叉研究领域,该数据集通过融合15分钟级停电观测与24种ERA5气象要素,为构建极端天气与电力中断的关联模型提供了标准化框架。研究人员可基于时空对齐的网格数据,分析飓风、热浪等气象事件对加州县级电网的链式影响,其高时间分辨率特性特别适合捕捉灾害演化的动态过程。
实际应用
电力企业可利用该数据集开发灾前预警系统,通过实时同化气象预报与历史停电模式,动态评估特定县域的断电风险等级。保险行业则依托其构建精算模型,将气象致灾概率与理赔预估相结合。政府部门还能基于时空聚合结果优化应急资源调配,提升区域能源安全治理效能。
衍生相关工作
以本数据集为基准,学界涌现出多项创新研究。例如结合图神经网络构建县域电力脆弱性传播模型,或利用时空注意力机制解析热浪期间空调负荷与停电的耦合关系。这些工作不仅扩展了气候韧性电网的分析维度,更催生了《自然·能源》等多篇高被引论文的诞生。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作