five

h2o

收藏
github2024-04-25 更新2024-05-31 收录
下载链接:
https://github.com/JoaquinAmatRodrigo/skforecast-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
澳大利亚卫生系统在1991年至2008年间每月花费在皮质类固醇药物上的费用(澳元)。

The monthly expenditure (in Australian dollars) on corticosteroid medications by the Australian healthcare system from 1991 to 2008.
创建时间:
2023-11-07
原始信息汇总

数据集概述

h2o

  • 描述: 澳大利亚卫生系统在1991年至2008年间每月花费在皮质类固醇药物上的费用($AUD)。
  • 来源: Hyndman R (2023). fpp3: Data for "Forecasting: Principles and Practice" (3rd Edition).

h2o_exog

  • 描述: 与h2o数据集相同,但增加了两个模拟变量(exog_1, exog_2)。
  • 来源: Hyndman R (2023). fpp3: Data for "Forecasting: Principles and Practice" (3rd Edition).

fuel_consumption

  • 描述: 西班牙从1969年1月1日至2022年8月1日的每月燃料消耗(吨)。
  • 来源: 西班牙石油战略储备公司和生态转型和人口挑战部。

items_sales

  • 描述: 模拟的3种不同商品的销售时间序列。
  • 来源: 模拟数据。

air_quality_valencia

  • 描述: 瓦伦西亚市每小时的多种空气化学污染物(pm2.5, co, no, no2, pm10, nox, o3, so2)测量。
  • 来源: 空气质量监测和控制网络,46250054-瓦伦西亚 - 中心。

website_visits

  • 描述: cienciadedatos.net网站通过Google Analytics服务记录的每日访问量。
  • 来源: Amat Rodrigo, J. (2021). cienciadedatos.net (1.0.0). Zenodo.

bike_sharing

  • 描述: 华盛顿特区2011年和2012年的自行车共享系统每小时使用情况,包括天气条件和节假日信息。
  • 来源: Fanaee-T, Hadi. (2013). Bike Sharing Dataset. UCI Machine Learning Repository.

bike_sharing_extended_features

  • 描述: 与bike_sharing数据集相同,但增加了额外的特征,如日历变量、日照指示、滚动温度平均值和变量对生成的多项式特征。
  • 来源: Fanaee-T, Hadi. (2013). Bike Sharing Dataset. UCI Machine Learning Repository.

australia_tourism

  • 描述: 1998年第一季度至2016年第四季度澳大利亚各地的季度过夜旅行(千次)。
  • 来源: Wang, E, D Cook, and RJ Hyndman (2020). A new tidy data structure to support exploration and modeling of temporal data.

uk_daily_flights

  • 描述: 2019年1月2日至2022年1月23日英国每日航班数量。
  • 来源: 英国国家统计局,欧洲空中航行安全组织(EUROCONTROL)。

wikipedia_visits

  • 描述: 佩顿·曼宁维基百科页面的日志每日页面浏览量。
  • 来源: 使用R中的Wikipediatrend包抓取的数据。

vic_electricity

  • 描述: 澳大利亚维多利亚州的半小时电力需求。
  • 来源: OHara-Wild M, Hyndman R, Wang E, Godahewa R (2022). tsibbledata: Diverse Datasets for tsibble.

store_sales

  • 描述: 2013年1月1日至2017年12月31日,50种产品在10家商店的913,000笔销售交易。
  • 来源: inversion. (2018). Store Item Demand Forecasting Challenge. Kaggle.

bicimad

  • 描述: 2014年6月23日至2022年9月30日马德里市自行车租赁服务(BiciMad)的每日用户。
  • 来源: 马德里市政府开放数据门户。

m4_hourly

  • 描述: M4竞赛中的小时频率时间序列。
  • 来源: Monash Time Series Forecasting Repository.

m4_daily

  • 描述: M4竞赛中的日频率时间序列。
  • 来源: Monash Time Series Forecasting Repository.

air_pollution

  • 描述: 未提供。
  • 来源: 未提供。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集'h2o'的构建基于澳大利亚卫生系统在1991年至2008年间每月在皮质类固醇药物上的支出数据。数据来源于Hyndman R (2023)的fpp3包,该包提供了《Forecasting: Principles and Practice》第三版的配套数据。数据以CSV格式存储,包含日期索引(格式为%Y-%m-%d),并以月度频率(MS)记录。通过这种方式,数据集为时间序列分析提供了详细的历史支出记录,便于进行预测和趋势分析。
特点
该数据集的主要特点在于其时间序列的连续性和频率的稳定性。数据涵盖了长达17年的月度支出记录,提供了丰富的历史数据,便于进行长期趋势分析和预测。此外,数据集的结构简单,仅包含日期和支出金额两列,便于快速加载和处理。由于数据来源于权威机构,其可靠性和真实性得到了保障,适合用于各种时间序列预测模型的训练和验证。
使用方法
使用该数据集时,可以通过skforecast库中的`fetch_dataset()`函数直接下载并加载数据。具体操作如下:首先,导入skforecast库并调用`fetch_dataset()`函数,指定数据集名称为'h2o'。加载后的数据可以直接用于时间序列分析、预测模型训练等任务。由于数据集结构简单,用户可以轻松进行数据预处理、特征工程等操作,以适应不同的分析需求。
背景与挑战
背景概述
h2o数据集由Rob J. Hyndman教授及其团队于2023年创建,主要用于时间序列预测研究。该数据集记录了1991年至2008年间澳大利亚卫生系统每月在皮质类固醇药物上的支出(以澳元计)。作为《Forecasting: Principles and Practice》第三版的配套数据集,h2o不仅为时间序列分析提供了丰富的历史数据,还为研究人员提供了一个标准化的数据集,用于验证和比较不同预测模型的性能。该数据集的发布对时间序列预测领域产生了深远的影响,尤其是在医疗支出预测和政策制定方面。
当前挑战
h2o数据集的主要挑战在于其时间序列的复杂性和潜在的非线性趋势。首先,医疗支出数据可能受到多种外部因素的影响,如政策变化、经济波动和季节性需求,这些因素使得预测任务变得复杂。其次,数据集的时间跨度较长,可能存在数据缺失或异常值,这要求在构建预测模型时进行有效的数据预处理和插值。此外,如何在高维时间序列数据中提取有效的特征,并结合外部变量进行预测,也是该数据集面临的重要挑战。
常用场景
经典使用场景
h2o数据集的经典使用场景主要集中在时间序列预测领域,特别是针对澳大利亚医疗系统在1991年至2008年间每月在皮质类固醇药物上的支出进行预测。该数据集通过提供详细的月度支出数据,为研究人员提供了一个理想的时间序列分析平台,用于开发和验证各种预测模型,如ARIMA、指数平滑等。
衍生相关工作
h2o数据集的发布和应用催生了一系列相关研究工作,包括但不限于时间序列预测模型的改进、多变量时间序列分析以及基于机器学习的预测方法。这些研究不仅推动了时间序列分析领域的发展,还为其他领域的数据分析提供了宝贵的经验和方法论。
数据集最近研究
最新研究方向
在时间序列预测领域,h2o数据集因其记录了澳大利亚卫生系统在1991年至2008年间每月在皮质类固醇药物上的支出而备受关注。该数据集为研究时间序列分析、预测模型优化以及季节性趋势识别提供了丰富的实验基础。近年来,随着机器学习和深度学习技术的快速发展,h2o数据集被广泛应用于开发和验证新型预测算法,尤其是在处理长期依赖性和季节性波动方面。此外,h2o数据集的公开性和详细的时间戳信息,使其成为评估不同预测模型性能的标准数据集之一,尤其是在医疗支出预测和政策制定领域具有重要的应用价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作