Monash-University/monash_tsf|时间序列预测数据集|多领域应用数据集
收藏数据集概述
基本信息
- 数据集名称: Monash Time Series Forecasting Repository
- 数据集类型: 时间序列预测
- 语言: 单一语言
- 许可: CC-BY-4.0
- 数据集大小: 1K<n<10K
- 源数据: 原始数据
- 任务类型: 时间序列预测
- 任务ID: 单变量时间序列预测、多变量时间序列预测
数据集配置
数据集包含多个配置,每个配置具有不同的特征和分割:
配置: weather
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 3010个样本,176893738字节test
: 3010个样本,177638713字节validation
: 3010个样本,177266226字节
- 下载大小: 38820451字节
- 数据集大小: 531798677字节
配置: tourism_yearly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 518个样本,54264字节test
: 518个样本,71358字节validation
: 518个样本,62811字节
- 下载大小: 36749字节
- 数据集大小: 188433字节
配置: tourism_quarterly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 427个样本,162738字节test
: 427个样本,190920字节validation
: 427个样本,176829字节
- 下载大小: 93833字节
- 数据集大小: 530487字节
配置: tourism_monthly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 366个样本,391518字节test
: 366个样本,463986字节validation
: 366个样本,427752字节
- 下载大小: 199791字节
- 数据集大小: 1283256字节
配置: cif_2016
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 72个样本,24731字节test
: 72个样本,31859字节validation
: 72个样本,28295字节
- 下载大小: 53344字节
- 数据集大小: 84885字节
配置: london_smart_meters
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 5560个样本,684386194字节test
: 5560个样本,687138394字节validation
: 5560个样本,685762294字节
- 下载大小: 219673439字节
- 数据集大小: 2057286882字节
配置: australian_electricity_demand
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 5个样本,4763162字节test
: 5个样本,4765637字节validation
: 5个样本,4764400字节
- 下载大小: 5770526字节
- 数据集大小: 14293199字节
配置: wind_farms_minutely
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 339个样本,710078918字节test
: 339个样本,710246723字节validation
: 339个样本,710162820字节
- 下载大小: 71383130字节
- 数据集大小: 2130488461字节
配置: bitcoin
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 18个样本,336511字节test
: 18个样本,340966字节validation
: 18个样本,338738字节
- 下载大小: 220403字节
- 数据集大小: 1016215字节
配置: pedestrian_counts
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 66个样本,12897120字节test
: 66个样本,12923256字节validation
: 66个样本,12910188字节
- 下载大小: 4587054字节
- 数据集大小: 38730564字节
配置: vehicle_trips
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 329个样本,105261字节test
: 329个样本,186688字节validation
: 329个样本,145974字节
- 下载大小: 44914字节
- 数据集大小: 437923字节
配置: kdd_cup_2018
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 270个样本,12040046字节test
: 270个样本,12146966字节validation
: 270个样本,12093506字节
- 下载大小: 2456948字节
- 数据集大小: 36280518字节
配置: nn5_daily
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 111个样本,314828字节test
: 111个样本,366110字节validation
: 111个样本,340469字节
- 下载大小: 287708字节
- 数据集大小: 1021407字节
配置: nn5_weekly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 111个样本,48344字节test
: 111个样本,55670字节validation
: 111个样本,52007字节
- 下载大小: 62043字节
- 数据集大小: 156021字节
配置: kaggle_web_traffic
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 145063个样本,415494391字节test
: 145063个样本,486103806字节validation
: 145063个样本,450799098字节
- 下载大小: 145485324字节
- 数据集大小: 1352397295字节
配置: kaggle_web_traffic_weekly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 145063个样本,64242469字节test
: 145063个样本,73816627字节validation
: 145063个样本,69029548字节
- 下载大小: 28930900字节
- 数据集大小: 207088644字节
配置: solar_10_minutes
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 137个样本,29640033字节test
: 137个样本,29707848字节validation
: 137个样本,29673941字节
- 下载大小: 4559353字节
- 数据集大小: 89021822字节
配置: solar_weekly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 137个样本,28614字节test
: 137个样本,34265字节validation
: 137个样本,31439字节
- 下载大小: 24375字节
- 数据集大小: 94318字节
配置: car_parts
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 2674个样本,396653字节test
: 2674个样本,661379字节validation
: 2674个样本,529016字节
- 下载大小: 39656字节
- 数据集大小: 1587048字节
配置: fred_md
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 107个样本,314514字节test
: 107个样本,325107字节validation
: 107个样本,319811字节
- 下载大小: 169107字节
- 数据集大小: 959432字节
配置: traffic_hourly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
: 字符串
- 分割:
train
: 862个样本,62071974字节test
: 862个样本,62413326字节validation
: 862个样本,62242650字节
- 下载大小: 22868806字节
- 数据集大小: 186727950字节
配置: traffic_weekly
- 特征:
start
: 时间戳target
: 浮点数序列feat_static_cat
: 无符号整数序列feat_dynamic_real
: 浮点数序列的序列item_id
:

TaRF
TaRF 是由密歇根大学、耶鲁大学和加州大学伯克利分校联合创建的视触融合场景数据集,旨在将视觉与触觉信号对齐至共享的三维空间。该数据集包含 19.3k 对齐的视觉与触觉样本,覆盖 13 个普通场景,如办公室、走廊和户外环境。数据采集通过结合神经辐射场(NeRF)和触觉传感器完成,利用多视图几何方法校准视觉与触觉信号,实现空间对齐。TaRF 的创建过程包括场景的多视角视觉重建和同步采集触觉信号,最终通过扩散模型生成未直接采样的触觉信号。该数据集可用于触觉信号估计、触觉定位和材料属性理解等任务,为机器人交互和虚拟世界构建提供重要支持。
github 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
中国高分辨率高质量PM2.5数据集(2000-2023)
ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。
国家青藏高原科学数据中心 收录
中国近海台风路径集合数据集(1945-2023)
1945-2023年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。注:时间为北京时间。
国家海洋科学数据中心 收录
World Flights
该数据集包含使用OpenSky Network实时API收集的两小时飞行数据。飞行颜色基于出发国家,记录了18000次飞行,由于缺乏卫星覆盖,海洋上的航线不完整。每条航线还加入了来自airlinecodes.co.uk的航空公司信息。
github 收录