structural-french-grid-data-with-detailed-topology-time-series|电力网络数据集|拓扑结构数据集
收藏数据集概述
数据集简介
该数据集提供了法国输电网络的节点-断路器拓扑结构的一系列快照,时间粒度为5分钟,覆盖了2021年至2023年的时间段。数据仅描述了电网的结构和拓扑,不包含注入和功率流信息。快照以压缩的**xiidm**格式提供。
数据集内容
每个网络文件包含以下详细信息:
- 变电站:电气变电站的详细信息,拓扑结构为节点-断路器格式。
- 开关:描述隔离开关和其他开关设备(位置和连接状态)。
- 线路和变压器:传输线路和变压器的静态特性信息,包括热限值。不显示功率流。
- 负载:网络上的负载(消耗)位置及其连接状态。不显示注入。
- 发电机:关于发电机的位置、能源类型、连接状态以及静态数据(如最小/最大有功功率限制)的信息。不显示注入。
- 其他元素:包括电网的其他关键组件(移相变压器、高压直流线路、高压直流换流站、并联电抗器、电容器、电池等)。
网络元素的标识符在时间上保持一致,确保在整个覆盖期间的可追溯性和一致性。然而,在维护或网络结构修改的情况下,标识符可能会发生变化。
数据格式
- 格式:数据以**xiidm**格式(bzip2压缩)提供。
- 兼容性:快照可通过**pypowsybl或PowSyBl读取,便于电网的操纵和分析。Python笔记本可在GitHub**上获取,以帮助用户操纵数据。
- 时间粒度:每5分钟一个快照,支持对电网拓扑演变的细粒度分析(每5分钟一个文件)。
- 空间范围:法国输电网络的所有结构组件均被表示,电压等级从63 kV到400 kV。与邻国的互联线路被建模为悬空线路。
局限性
- 不包含功率流和注入:数据不包含功率流或注入信息。仅提供网络的结构和拓扑信息。为了计算功率流,需要使用开源聚合数据进行注入重建。重建方法由M. Chatzos、M. Tanneau和P. Van Hentenryck在"Data-driven time series reconstruction for modern power systems research"(《电力系统研究》,2022年)中提出。然后,可以使用传统的仿真工具计算功率流。
潜在用途
该数据集非常适合开发电网拓扑优化和功率流控制的优化和AI模型,因为它代表了电网拓扑的真实变化。
备注
- ID变更:用户应注意由于维护或结构修改可能导致的ID变更。
- 开源注入数据列表:
- Eco2mix - 法国实时电力数据:https://www.rte-france.com/en/eco2mix
- 实际发电单位发电量:https://data.rte-france.com/catalog/-/api/generation/Actual-Generation/v1.1
- ENTSO-E透明度平台 - 跨境物理流量:https://transparency.entsoe.eu/transmission-domain/physicalFlow/show
路线图
- 20241220:发布前两个月(2021年1月和2月)的数据。
- 20250330:发布完整数据集(2021年、2022年和2023年,共36个月)。
作者
- Selim Ben Turkia:数据开发人员,负责从源数据库中提取和清理数据。
- Camille Pache:出版项目的经理。
- Boris Dolley:公共数据集的GitHub发布者。
- Lucas Saludjian:科学顾问。
- Patick Panciatici:高级科学顾问。

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国30米分辨率土壤可蚀性因子数据集
该数据集为2018年中国30米分辨率土壤可蚀性因子(K)栅格数据,数据是利用中国1979-1994年的全国第二次土壤普查的成果数据进行计算;再利用径流小区观测数据修正计算结果;将修订结果利用反距离权重插值法插值生成栅格数据。特殊地类河湖库塘、冰川及永久积雪、裸岩土地类型K因子值强制赋值为0。如果用户采用的土地利用精度较高,建议重新对以下土地类型的K因子强制赋值为0:河湖库塘、冰川及永久积雪、裸岩。如果有K值为0,但不属于上述类型的,K因子可按如下原则:取邻近相同土地类型图斑的K值,或取与该图斑邻近且不等于0的所有图斑K值的平均值。
国家地球系统科学数据中心 收录
Sleep
该数据集包含关于睡眠效率和持续时间的信息,每个条目代表一个独特的睡眠体验,并包括ID、年龄、性别、睡眠持续时间、睡眠效率、REM睡眠百分比、深度睡眠百分比、轻度睡眠百分比、觉醒次数、咖啡因消费、酒精消费和吸烟状况等列。
github 收录
PQAref
PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。
huggingface 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录