five

Electricity-Consumption-1.0|能源消耗数据集|时间序列分析数据集

收藏
huggingface2024-11-26 更新2024-12-12 收录
能源消耗
时间序列分析
下载链接:
https://huggingface.co/datasets/OpenSynth/Electricity-Consumption-1.0
下载链接
链接失效反馈
资源简介:
该数据集包含用于能源消耗分析的时间序列数据,具有以下特征:'id'(数据集标识符,格式为'国家_家庭编号')、'datetime'(观测日期和时间)、'target'(以千瓦时为单位的能源消耗量)和'category'(时间序列的分辨率,如15分钟、30分钟、60分钟)。数据来源包括荷兰、英国、德国和澳大利亚的智能电表数据集,每个数据集都有特定的时间段、粒度和范围。该数据集已被用于多个研究项目,并提供了使用Python库加载和处理数据的说明。
创建时间:
2024-11-26
原始信息汇总

数据集概述

数据集信息

  • 数据集名称: Electricity-Consumption-1.0
  • 许可证: CC BY 4.0

数据集特征

  • id: 数据集标识符,格式为 Country_Number of Household(例如,GE_1 表示德国,家庭1)。
  • datetime: 时间戳,表示观测的日期和时间。
  • target: 能量消耗,以千瓦时(kWh)为单位。
  • category: 时间序列的分辨率(例如,15分钟、30分钟、60分钟)。

数据来源

1. 荷兰智能电表数据

  • 来源: Liander Open Data
  • 数据集名称: Zonnedael Dataset
  • 时间周期:
    • 电力: 2012年5月1日 – 2014年3月7日
  • 粒度:
    • 电力: 60分钟间隔
  • 范围:
    • 约80个地址,包含用户同意的智能电表数据。
    • 数据单位: Wh/15min(电力)。
    • 数据已修正缺失值、不现实的消耗或必要时的插值。
    • 包含家庭类型、房屋年龄和结构的元数据,通过匿名客户ID链接。

2. 英国智能电表数据

  • 来源: London Datastore
  • 数据集名称: Low Carbon London Project
  • 时间周期: 2011年11月 – 2014年2月
  • 粒度: 30分钟间隔
  • 范围:
    • 5,567个伦敦家庭的能源消耗数据。
    • 总计约1.67亿条记录(10GB未压缩)。
    • 两个客户组:
      1. 1,100个家庭参与2013年的动态分时电价(dToU)试验,暴露于可变电价(高、低、正常)。电价计划与数据集一起提供。
      2. 4,500个家庭采用固定电价。
    • 设计用于测试电价对消费行为和配电网压力的影响。

3. 德国智能电表数据

  • 来源: Open Power System Data
  • 数据集名称: CoSSMic Household Load and Solar Data
  • 时间周期: 因家庭而异;第二次发布包括插值和处理后的数据。
  • 粒度:
    • 1分钟间隔(原始)
    • 聚合到15分钟和每小时间隔
  • 范围:
    • 德国南部的11个住宅和小型商业家庭。
    • 包括家庭级别的负荷和太阳能发电数据。
    • 涵盖单设备消耗,间隙使用前一天数据插值或填充。
    • 保留累计发电/消耗数据。

4. 澳大利亚智能电表数据

  • 来源: Smart-Grid Smart-City Customer Trial Data
  • 数据集名称: SGSC Customer Trial Data
  • 时间周期: 2010 – 2014
  • 粒度: 30分钟间隔
  • 范围:
    • 澳大利亚大规模智能电网示范项目的一部分。
    • 包括与人口统计特征、电器使用、高峰事件响应和零售优惠相关的能源消耗数据。
    • 数据已匿名化,并通过客户ID链接。
    • 伴随气候条件和产品接受率等元数据。

相关研究

AI搜集汇总
数据集介绍
main_image_url
构建方式
Electricity-Consumption-1.0数据集通过整合多个国家的高分辨率智能电表数据构建而成,涵盖了荷兰、英国、德国和澳大利亚的能源消耗模式。数据来源包括Liander Open Data、London Datastore、Open Power System Data以及Smart-Grid Smart-City Customer Trial Data。这些数据经过清洗和校正,确保缺失值和不合理的消耗数据得到处理,并通过插值方法填补空缺。每个数据源均提供了详细的元数据,如家庭类型、建筑年代和气候条件,以支持多维度的分析。
特点
该数据集具有多样化的时间分辨率和广泛的覆盖范围,时间间隔从15分钟到60分钟不等,涵盖了数千户家庭的能源消耗记录。数据集中包含`id`、`datetime`、`target`和`category`四个关键特征,分别用于标识家庭、记录时间戳、能耗值以及时间分辨率。此外,数据集还提供了丰富的元信息,如家庭类型、电价试验数据以及太阳能发电数据,为研究能源消耗行为提供了全面的支持。
使用方法
使用Electricity-Consumption-1.0数据集时,可通过`datasets`库加载数据,并将其转换为pandas DataFrame以便进一步分析。示例代码展示了如何读取Parquet格式的数据文件并将其转换为DataFrame。用户可以根据需要选择不同国家或时间分辨率的数据进行深入研究。该数据集适用于能源消耗模式分析、生成模型训练以及电价政策效果评估等多种应用场景。
背景与挑战
背景概述
Electricity-Consumption-1.0数据集由荷兰代尔夫特理工大学的Weijie Xia和Pedro P. Vergara主导创建,旨在为电力消费行为的研究提供高质量的时间序列数据。该数据集整合了来自荷兰、英国、德国和澳大利亚的智能电表数据,涵盖了不同时间分辨率的电力消耗记录。数据集的核心研究问题聚焦于电力消费模式的建模与预测,特别是在不同时间尺度下的动态变化。通过提供多国、多时间分辨率的数据,该数据集为电力系统优化、需求响应策略设计以及智能电网技术的研究提供了重要支持。其影响力不仅体现在学术研究领域,还为电力行业的实际应用提供了数据基础。
当前挑战
Electricity-Consumption-1.0数据集在构建和应用过程中面临多重挑战。首先,数据来源的多样性和异构性增加了数据整合与清洗的难度,不同国家的数据格式、时间分辨率和计量单位存在显著差异,需进行标准化处理。其次,数据缺失和异常值的处理是另一大挑战,尤其是在高时间分辨率下,数据采集的连续性和准确性难以保证。此外,数据隐私保护问题也需谨慎处理,尽管数据已进行匿名化处理,但仍需确保其符合相关法律法规。在应用层面,如何从高维时间序列数据中提取有效特征,并构建鲁棒的预测模型,是研究者面临的核心技术挑战。
常用场景
经典使用场景
Electricity-Consumption-1.0数据集在时间序列分析领域具有广泛的应用,特别是在电力消费模式的建模与预测中。该数据集通过高分辨率的时间序列数据,捕捉了不同国家和地区的家庭电力消费行为,为研究人员提供了丰富的实验材料。经典使用场景包括利用该数据集进行电力消费的短期和长期预测,以及通过机器学习模型分析不同时间尺度下的消费模式变化。
实际应用
在实际应用中,Electricity-Consumption-1.0数据集被广泛用于智能电网的优化和电力需求管理。通过分析该数据集,电力公司能够更好地理解用户的消费行为,从而制定更有效的电价策略和需求响应方案。此外,该数据集还为电力系统的负荷预测提供了可靠的数据支持,帮助电力公司提高电网的稳定性和效率。
衍生相关工作
该数据集衍生了一系列经典研究工作,包括基于生成模型的电力消费模式生成与预测研究。例如,研究人员利用该数据集开发了基于Transformer的生成模型,用于生成用户级别的电力消费曲线。此外,还有研究基于该数据集提出了条件概率模型,用于电力消费的预测与生成。这些工作不仅推动了电力消费建模技术的发展,也为智能电网的优化提供了新的思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

SSDD遥感SAR目标检测数据集-COCO格式

SSDD遥感SAR目标检测数据集-COCO格式,按照官方制定方式划分训练/验证集

AI_Studio 收录