SYNTHETIC DATASET OF FRENCH ELECTRIC LOAD CURVES WITH TEMPERATURE CONDITIONING
收藏arXiv2025-04-19 更新2025-04-23 收录
下载链接:
https://zenodo.org/records/15232742
下载链接
链接失效反馈官方服务:
资源简介:
本数据集是由EDF R&D和Enedis共同发布的合成数据集,包含了一年的法国居民电力负载曲线,以及相关的合同电力、分时电价计划和生成所用到的当地温度数据。该数据集通过条件潜在扩散模型生成,能够反映温度对电力消耗的影响,共有10k条负载曲线数据,适用于电力系统分析和智能电网研究等领域。
This dataset is a synthetic dataset jointly released by EDF R&D and Enedis, containing one-year residential electricity load curves in France, along with relevant contracted power capacities, time-of-use tariff plans, and local temperature data used for its generation. Generated via Conditional Latent Diffusion Models, this dataset can reflect the impact of temperature on electricity consumption, includes a total of 10k load curve samples, and is applicable to fields such as power system analysis and smart grid research.
提供机构:
EDF R&D, France
创建时间:
2025-04-19
搜集汇总
数据集介绍

构建方式
该数据集通过条件潜在扩散模型生成,首先利用卷积自编码器将30分钟分辨率的负荷曲线压缩为潜在空间表示,随后采用去噪扩散概率模型学习潜在代码的分布。模型创新性地引入静态变量(如合约功率、分时电价计划)和动态外生变量(如室外温度)的双重条件机制,通过交叉注意力层实现温度数据与负荷曲线的动态关联。数据生成阶段基于17,000条真实法国居民年度负荷曲线进行训练,确保了生成样本的时序一致性和温度敏感性。
使用方法
该数据集适用于电力负荷预测、需求响应算法开发等研究场景。使用时应结合提供的温度数据进行条件分析,建议采用TSTR(合成数据训练-真实数据测试)评估框架。对于短期负荷预测任务,推荐使用720步长(15天)的滑动窗口输入,配合PatchTST等时序Transformer模型;分类任务可采用kNN算法对104维特征向量(包含日/冬季负荷曲线及统计量)进行处理。需注意不同合约功率和分时电价类别的样本分布差异,必要时进行分层抽样以确保模型泛化性。
背景与挑战
背景概述
法国电力负荷曲线合成数据集(SYNTHETIC DATASET OF FRENCH ELECTRIC LOAD CURVES WITH TEMPERATURE CONDITIONING)由EDF R&D和Enedis的研究团队于2025年发布,旨在应对能源转型中电力消费行为变化的分析需求。该数据集通过条件潜在扩散模型生成,包含一年期30分钟分辨率的电力负荷曲线,并结合了合同功率、分时电价计划及当地温度等条件信息。其核心研究问题聚焦于如何在遵守欧盟《通用数据保护条例》(GDPR)的前提下,为能源建模提供高质量、隐私保护的合成数据。该数据集的发布填补了现有数据在时间分辨率和温度条件依赖性方面的空白,为智能电网优化、负荷预测等研究提供了重要资源。
当前挑战
该数据集构建面临双重挑战:在领域问题层面,需解决个体级电力消费数据的高粒度生成难题,同时准确捕捉温度对负荷曲线的影响特性(如法国电采暖导致的冬季负荷敏感性问题);在技术实现层面,挑战包括:1) 潜在扩散模型对长序列时间数据的建模复杂性,需平衡生成质量与计算效率;2) 多模态条件机制的设计,需同步整合静态特征(合同功率)与动态变量(温度时序);3) 隐私保护与数据效用的博弈,需通过自动编码器量化正则化等技术防止训练数据泄露,同时保持生成的负荷曲线在统计特性上的真实性。
常用场景
经典使用场景
在能源系统建模与智能电网研究中,该数据集通过生成高保真度的合成负荷曲线,为分析温度敏感型用电行为提供了基准工具。其30分钟分辨率、全年覆盖的特性,结合合同功率和分时电价标签,使得研究者能够模拟法国居民在极端气候条件下的用电响应,尤其适用于冬季供暖主导型负荷的模式分析。
解决学术问题
该数据集有效解决了智能电表数据因隐私保护法规(如GDPR)难以获取的学术瓶颈,填补了现有合成数据在时间粒度和温度耦合机制上的空白。通过条件潜在扩散模型生成的样本,研究者可探究温度梯度与用电量的非线性关系,验证负荷预测算法在个体用户层面的泛化能力,同时规避了真实数据泄露风险。
实际应用
电网运营商可利用该数据集设计需求响应策略,模拟不同温度情景下的负荷转移潜力。能源服务商则能基于合成数据开发个性化电价套餐,例如针对夜间分时电价用户优化供暖控制算法。此外,数据中嵌入的温度敏感性特征为建筑能效改造提供了量化评估依据。
数据集最近研究
最新研究方向
在能源转型与气候变化的背景下,法国电力负荷曲线的合成数据集研究正聚焦于隐私保护与数据保真度的平衡。该数据集采用条件潜在扩散模型生成,融合了温度、合约功率及分时电价等多维条件变量,为智能电网研究提供了高保真度的仿真数据。前沿探索集中在三个维度:一是通过改进扩散模型架构提升负荷曲线的时空动态建模能力,尤其在捕捉温度敏感型用电行为(如冬季电采暖)方面表现突出;二是开发新型评估框架,将传统保真度指标扩展到包含热敏梯度分析等能源领域特异性指标;三是探索生成数据在负荷预测、需求响应等下游任务中的迁移应用,如近期研究已证明其训练的Transformer模型在短期负荷预测中达到与真实数据相当的精度。该数据集的价值在于突破了欧盟GDPR法规对真实用电数据共享的限制,为应对气候变化的关键技术——如需求侧管理算法开发、分布式能源系统优化等研究提供了合规数据基础。
相关研究论文
- 1A synthetic dataset of French electric load curves with temperature conditioningEDF R&D, France · 2025年
以上内容由遇见数据集搜集并总结生成



