ETDataset/ett|电力变压器数据集|时间序列预测数据集
收藏数据集概述
数据集基本信息
- 名称: Electricity Transformer Temperature
- 许可证: CC BY 4.0
- 语言多样性: 单语种
- 大小分类: 1K<n<10K
- 源数据: 原始数据
- 任务类别: 时间序列预测
- 任务ID:
- 单变量时间序列预测
- 多变量时间序列预测
数据集结构
配置信息
-
h1
- 特征:
start
: 时间戳[s]target
: 序列, float32feat_static_cat
: 序列, uint64feat_dynamic_real
: 序列, 序列, float32item_id
: 字符串
- 分割:
train
: 241978字节, 1个样本test
: 77508960字节, 240个样本validation
: 33916080字节, 120个样本
- 下载大小: 2589657字节
- 数据集大小: 111667018字节
- 特征:
-
h2
- 特征:
start
: 时间戳[s]target
: 序列, float32feat_static_cat
: 序列, uint64feat_dynamic_real
: 序列, 序列, float32item_id
: 字符串
- 分割:
train
: 241978字节, 1个样本test
: 77508960字节, 240个样本validation
: 33916080字节, 120个样本
- 下载大小: 2417960字节
- 数据集大小: 111667018字节
- 特征:
-
m1
- 特征:
start
: 时间戳[s]target
: 序列, float32feat_static_cat
: 序列, uint64feat_dynamic_real
: 序列, 序列, float32item_id
: 字符串
- 分割:
train
: 967738字节, 1个样本test
: 1239008640字节, 960个样本validation
: 542089920字节, 480个样本
- 下载大小: 10360719字节
- 数据集大小: 1782066298字节
- 特征:
-
m2
- 特征:
start
: 时间戳[s]target
: 序列, float32feat_static_cat
: 序列, uint64feat_dynamic_real
: 序列, 序列, float32item_id
: 字符串
- 分割:
train
: 967738字节, 1个样本test
: 1239008640字节, 960个样本validation
: 542089920字节, 480个样本
- 下载大小: 9677236字节
- 数据集大小: 1782066298字节
- 特征:
数据集描述
数据集摘要
该数据集包含两年的电力变压器温度数据,数据频率为每小时或每15分钟一次。目标时间序列是油温,数据集包含以下六个协变量:
- 高有效负载
- 高无效负载
- 中有效负载
- 中无效负载
- 低有效负载
- 低无效负载
数据集使用
加载特定变体的数据集示例: python load_dataset("ett", "m1", multivariate=False) # 单变量15分钟频率数据集,来自第一个变压器
或指定预测长度: python load_dataset("ett", "h2", prediction_length=48) # 多变量数据集,来自第二个变压器,预测长度为48小时
支持的任务和排行榜
时间序列数据被分为训练/验证/测试集,分别为12/4/4个月。给定预测长度(默认:1天,24小时或24*4 15分钟),我们为验证/测试集创建滚动窗口。
时间序列预测
- 单变量时间序列预测: 学习数据集中时间序列的未来一维
target
值,预测未来prediction_length
时间步的值。 - 多变量时间序列预测: 学习数据集中时间序列的未来向量
target
值,预测未来prediction_length
时间步的值。

中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
FAOSTAT Forestry
FAOSTAT Forestry数据集包含了全球森林资源的相关统计数据,涵盖了森林面积、木材产量、森林管理等多个方面。该数据集提供了详细的国别数据,帮助用户了解全球森林资源的现状和变化趋势。
www.fao.org 收录
NREL Wind Integration National Dataset (WIND) Toolkit
NREL Wind Integration National Dataset (WIND) Toolkit 是一个包含美国大陆风能资源和电力系统集成数据的综合数据集。该数据集提供了高分辨率的风速、风向、风能密度、电力输出等数据,覆盖了美国大陆的多个地理区域。这些数据有助于研究人员和工程师进行风能资源评估、电力系统规划和集成研究。
www.nrel.gov 收录
LogiQA
LogiQA 包含 8,678 个 QA 实例,涵盖多种类型的演绎推理。结果表明,最先进的神经模型的性能远远低于人类天花板。该数据集还可以作为在深度学习 NLP 设置下重新研究逻辑 AI 的基准。
OpenDataLab 收录