Chickenpox Cases in Hungary
收藏arXiv2021-02-16 更新2024-06-21 收录
下载链接:
https://github.com/benedekrozemberczki/spatiotemporal_datasets
下载链接
链接失效反馈官方服务:
资源简介:
Chickenpox Cases in Hungary数据集由爱丁堡大学发布,包含匈牙利各县每周报告的麻疹病例时间序列数据,共计超过500条记录。该数据集通过手动收集匈牙利流行病学信息,覆盖了2005年至2015年的时间段。数据集的应用领域主要集中在时空信号处理和图神经网络模型的性能比较,旨在解决时空机器学习中的预测问题,如病例数预测和模型性能评估。
The Chickenpox Cases in Hungary dataset, released by the University of Edinburgh, comprises weekly time-series data of measles cases reported by every county in Hungary, with a total of over 500 records. This dataset was manually collected from Hungarian epidemiological surveillance data, spanning the period from 2005 to 2015. Its core application areas focus on spatial-temporal signal processing and performance benchmarking of graph neural network models, aiming to address prediction tasks in spatio-temporal machine learning, including case count prediction and model performance evaluation.
提供机构:
爱丁堡大学
创建时间:
2021-02-16
搜集汇总
数据集介绍

构建方式
Chickenpox Cases in Hungary数据集的构建方式是将匈牙利各县每周报告的水痘病例数作为时间序列数据。研究者手动收集了2005年1月至2015年1月期间的数据,确保了数据的完整性和连续性。此外,数据集还包括一个描述各县之间空间连接的图结构,该图由20个节点(19个县和首都布达佩斯)和61条边组成,用于模拟水痘病例的空间传播。
使用方法
使用Chickenpox Cases in Hungary数据集的方法包括预测未来边缘和顶点属性、评估图神经网络架构的性能和探索时空信号处理的新技术。研究者可以训练图卷积神经网络,结合循环神经网络层,以预测水痘病例数。此外,数据集还可以用于比较不同图神经网络架构在预测性能和预报能力方面的差异,从而推动图表示学习研究的进展。
背景与挑战
背景概述
在时空信号处理领域,图神经网络(Graph Neural Networks, GNNs)作为一种强大的机器学习方法,尤其在预测边缘和顶点属性方面表现出色。为了推动GNNs在时空信号处理领域的应用,研究人员需要具有挑战性的数据集来评估和比较不同的GNN架构。在这样的背景下,Rozemberczki等人于2021年提出了名为“Chickenpox Cases in Hungary”的数据集,该数据集记录了匈牙利各县每周报告的水痘病例数,时间跨度从2005年到2015年。这一数据集的发布为研究人员提供了一个新的基准,用以比较和评估GNNs在时空预测任务上的性能和预测能力。
当前挑战
Chickenpox Cases in Hungary数据集提出了几个关键的挑战,这些问题对于时空机器学习模型的设计和评估至关重要。首先,时间序列数据中的时间自相关性要求模型能够捕捉过去几周的数据如何影响当前周的病例数。其次,空间自相关性意味着相邻地区的病例数之间存在相关性,这要求模型能够理解和利用地区之间的这种联系。此外,数据集的季节性特征要求模型能够识别和解释病例数的年度周期性变化。同时,数据的异方差性意味着在不同时间点,病例数的波动性不同,模型需要能够适应这种变化。数据集还包含了计数数据的特点,这在模型设计时需要特别考虑,特别是在损失函数和输出层激活函数的选择上。此外,数据集中存在零膨胀现象,即某些较小的县在夏季报告的病例数为零,这为传统的计数数据模型带来了挑战。最后,数据集跨越了15年的时间,期间可能发生了人口结构变化和随机事件,这要求模型能够适应这种结构和趋势的变化。
常用场景
经典使用场景
在流行病学和空间时间序列分析领域,Chickenpox Cases in Hungary数据集被广泛应用于评估和比较图神经网络架构的预测性能和预报能力。该数据集包含了匈牙利各县的每周水痘病例报告,时间跨度从2005年到2015年,提供了丰富的时空信息。研究人员可以利用这个数据集来训练和测试他们的模型,以预测未来特定地区的水痘病例数量。此外,由于数据集的统计特性,如季节性、时空自相关性、零膨胀等,它也常被用于评估模型的鲁棒性和适应性。
解决学术问题
Chickenpox Cases in Hungary数据集解决了流行病学和空间时间序列分析中的一些常见问题。首先,该数据集为评估图神经网络模型在真实世界问题上的性能提供了一个基准。其次,数据集的统计特性如季节性、时空自相关性等,为研究人员提供了挑战,推动了模型设计和改进。此外,数据集的零膨胀和异方差性等特点,促使研究人员探索更有效的损失函数和激活函数,以提高模型的预测精度。
实际应用
Chickenpox Cases in Hungary数据集在实际应用中具有重要意义。首先,它可以帮助公共卫生部门预测水痘的传播趋势,从而更好地分配医疗资源和制定疫苗接种策略。其次,数据集的时空特性使得它也可用于其他流行病的预测和分析,如流感、手足口病等。此外,数据集的建模挑战推动了图神经网络模型的研究和发展,这些模型在其他领域如交通预测、天气预测等也具有广泛的应用前景。
数据集最近研究
最新研究方向
在图神经网络架构的时空信号处理领域中,Chickenpox Cases in Hungary数据集的发布为评估和比较新型图神经网络架构的预测性能和预测能力提供了新的基准。该数据集的时间序列分析和预测实验表明,其具备充分的预测性能,并能够展示新型循环图神经网络的架构。此外,该数据集的内在统计特性,如季节性、时空自相关性、零膨胀、异方差性和结构变化,为预测任务带来了挑战,并开辟了评估现有时空模型预测性能的新途径。
相关研究论文
- 1Chickenpox Cases in Hungary: a Benchmark Dataset for Spatiotemporal Signal Processing with Graph Neural Networks爱丁堡大学 · 2021年
以上内容由遇见数据集搜集并总结生成



