EnergyBench
收藏Hugging Face2025-05-15 更新2025-05-16 收录
下载链接:
https://huggingface.co/datasets/ai-iot/EnergyBench
下载链接
链接失效反馈官方服务:
资源简介:
EnergyBench数据集是一个开源的大型能源计量数据集,旨在支持多种能源分析应用,包括负荷分析、负荷预测等。该数据集收集了超过60个详细的电力消耗数据集,涵盖了大约78,000个真实建筑的全球建筑存量,提供了能源消耗在时间和空间上的变化洞察。
The EnergyBench dataset is an open-source large-scale energy metering dataset designed to support a variety of energy analysis applications, including load analysis, load forecasting, and more. This dataset collects over 60 detailed power consumption datasets, covering the global building stock of approximately 78,000 real-world buildings, and provides insights into the spatiotemporal variations of energy consumption.
创建时间:
2025-05-14
原始信息汇总
EnergyBench 数据集概述
基本信息
- 许可证: CC-BY-SA-4.0
- 任务类别: 时间序列预测
- 语言: 英语
- 标签: 能源、智能电表、电力、建筑、数据集、croissant
- 数据规模: 10B < n < 100B
数据集配置
商业建筑数据
- 时间粒度: 每小时、15分钟、30分钟
- 包含的子数据集:
- BDG-2、Berkely、CLEMD、CU-BEMS、DGS、ECRG-Commercial、Enernoc、EWELD、HB、IBlend、IOT、IPC-Commercial、NEST-Commercial、PSS、RKP、SEWA、SKC、UCIE、ULE、UNICON
光伏(PV)数据
- 时间粒度: 每小时、15分钟
- 包含的子数据集:
- DLEP、HSG、MYMG、SPV、SWC、SDWPF
风电数据
- 时间粒度: 每小时、15分钟
- 包含的子数据集:
- SDWPF、SWC
住宅数据
- 时间粒度: 每小时、15分钟、30分钟
- 包含的子数据集:
- AMPD、BTS、CEEW、DCB、DEDDIAG、DESM、DTH、ECCC、ECRG-Residential、ECWM、ENERTALK、fIEECe、GoiEner、GREEND、HES、HONDA-Smart-Home、HSG、HUE、iFlex、IHEPC、IPC-Residential、IRH、LCL、LEC、METER、MFRED、MIHEC、NDB、NEEA、NESEMP、NEST、Norwegian、PES、Plegma、Prayas、REED、REFIT、RHC、RSL、SAVE、SFAC、SGSC、SMART-Star、SRSA、UKST、WED
合成数据
- 时间粒度: 每小时、15分钟
- 包含的子数据集:
- SynD、Buildings-900K-Commercial、Buildings-900K-Residential、SDG
元数据
- 包含的文件:
- Metadata-datasets.csv
- missing/*.csv
数据格式
- 文件格式: Parquet
- 数据路径示例:
Dataset_V0.0/Energy-Load-Profiles/Hourly/Commercial/BDG-2/*.parquetDataset_V0.0/Synthetic-Energy-Load-Profiles/15min/SynD/*.parquet
搜集汇总
数据集介绍

构建方式
EnergyBench数据集通过整合全球范围内商业、住宅、光伏和风力发电等多个领域的智能电表数据构建而成。数据采集覆盖不同时间分辨率(15分钟、30分钟、小时级),采用标准化Parquet格式存储,确保数据的高效访问和处理。原始数据经过严格的清洗和标注流程,包括异常值检测、缺失值填补以及统一的时间戳对齐,为时间序列预测任务提供了可靠的基础。
特点
该数据集以其多源异构性著称,包含来自数十个独立子集的能源负荷曲线,地域分布横跨北美、欧洲和亚洲。时间跨度具有显著差异性,部分序列长达数年,能够捕捉季节性和周期性变化。数据维度涵盖有功功率、无功功率等关键电气参数,部分子集附带建筑类型、气候分区等元数据,为跨场景迁移学习创造了条件。
使用方法
使用者可通过HuggingFace平台按需加载特定配置的子数据集,支持按建筑类型(商业/住宅)或能源类型(光伏/风电)进行筛选。典型应用场景包括:使用PyTorch或TensorFlow构建LSTM、Transformer等时序模型进行负荷预测;结合metadata进行跨区域泛化性研究;或利用合成数据子集进行数据增强。建议预处理时注意不同子集的时间粒度差异,必要时进行重采样处理。
背景与挑战
背景概述
EnergyBench数据集作为能源消耗预测领域的重要资源,由多个研究机构联合构建,旨在解决商业与住宅建筑电力负荷预测的核心问题。该数据集整合了全球范围内不同气候区、建筑类型和用电模式的智能电表数据,时间分辨率涵盖15分钟至小时级别,为研究复杂能源消费模式提供了多尺度分析基础。其跨年度的负荷曲线记录显著提升了可再生能源并网、需求响应策略等智能电网关键技术的研发效率,已成为能源信息学领域最具代表性的基准测试平台之一。
当前挑战
该数据集面临的挑战主要体现在两方面:在领域问题层面,电力负荷预测需解决极端天气事件导致的消费模式突变、新型电器渗透带来的基线漂移等时变特性建模难题;在构建过程中,原始数据存在计量设备故障造成的异常值、不同区域采样频率不一致等问题,需开发自适应滤波算法与时空对齐技术。商业建筑数据因涉及隐私保护条款,部分关键特征字段需进行不可逆脱敏处理,这为挖掘深层用电行为特征增加了技术复杂度。
常用场景
经典使用场景
EnergyBench数据集作为能源时间序列预测领域的基准数据集,其经典应用场景聚焦于商业建筑、住宅及可再生能源系统的电力负荷模式分析。通过整合全球范围内不同气候带、建筑类型和用电行为的细粒度能耗数据(15分钟至小时级采样),该数据集为研究人员提供了验证负荷预测算法的标准化平台,尤其在处理多元时空关联性和异常用电模式识别方面展现出独特价值。
解决学术问题
该数据集有效解决了能源信息学中三个关键科学问题:一是突破了传统负荷预测模型在跨区域泛化能力上的瓶颈,通过多源异构数据融合验证了迁移学习框架的可行性;二是为可再生能源消纳研究提供了真实电网接口数据,量化了光伏/风电并网对负荷预测误差的影响机制;三是建立了建筑能耗强度(BEI)的标准化评估体系,使得不同研究间的能耗基准对比成为可能,推动了建筑节能领域的可重复性研究。
衍生相关工作
该数据集已催生若干具有影响力的衍生研究:MIT团队开发的TransEnergy框架利用其跨建筑类型数据验证了元学习在负荷预测中的优越性;欧盟GridAdapt项目基于PV子集提出了考虑天气不确定性的光伏出力修正模型;近期发表的《Nature Energy》论文则通过分析30万住宅样本,揭示了居民用电行为与建筑能效等级的非线性关系,相关成果已被纳入国际能源署(IEA)的评估标准。
以上内容由遇见数据集搜集并总结生成



