TSGBench
收藏arXiv2023-12-07 更新2024-06-21 收录
下载链接:
https://github.com/YihaoAng/TSGBench/
下载链接
链接失效反馈官方服务:
资源简介:
TSGBench是由新加坡国立大学研究团队创建的时间序列生成基准数据集,旨在为时间序列生成方法提供一个统一和全面的评估平台。该数据集包含10个公开可用的真实世界数据集,涵盖多个应用领域,如金融、能源、医疗等。数据集通过标准化预处理流程确保数据质量,并提供了一套全面的评估指标,包括模型基础、特征基础、距离基础等,以评估时间序列生成方法的性能。此外,TSGBench还引入了一种基于域适应的泛化测试,以评估方法在不同数据域间的适应能力。
TSGBench is a time series generation benchmark dataset created by the research team from the National University of Singapore, which aims to provide a unified and comprehensive evaluation platform for time series generation methods. This dataset comprises 10 publicly available real-world datasets spanning multiple application domains, including finance, energy, healthcare and others. It adopts a standardized preprocessing pipeline to guarantee data quality, and offers a comprehensive suite of evaluation metrics covering model-based, feature-based and distance-based categories to assess the performance of time series generation methods. Furthermore, TSGBench introduces a domain adaptation-based generalization test to evaluate the cross-domain adaptation ability of the evaluated methods.
提供机构:
新加坡国立大学
创建时间:
2023-09-07
搜集汇总
数据集介绍

构建方式
TSGBench的构建方式体现了对时间序列生成(TSG)方法全面评估的迫切需求。该数据集由三个核心模块组成:首先,精心挑选了来自不同领域的十个公开可用、真实世界的时间序列数据集,并配备了标准化的预处理管道,以确保数据的一致性和可比性。其次,引入了一套全面的评估指标,包括传统的模型基础指标、新颖的距离基础评估以及可视化工具,以多维度地衡量生成时间序列的质量。最后,创新性地采用了基于领域适应(DA)的泛化测试,以评估TSG方法在不同领域间的迁移能力。
特点
TSGBench的显著特点在于其全面性和多样性。数据集不仅涵盖了多个应用领域的真实时间序列数据,还通过标准化的预处理流程确保了数据的质量和一致性。评估指标的多样性使得能够从多个角度对生成的时间序列进行细致的分析,包括模型性能、特征保持和训练效率等。此外,基于领域适应的泛化测试为评估TSG方法的实际应用潜力提供了新的视角。
使用方法
TSGBench的使用方法旨在为研究人员和从业者提供一个系统化的工具,以评估和比较不同的时间序列生成方法。用户可以通过加载预处理后的数据集,应用数据集提供的评估指标来衡量生成时间序列的质量。此外,用户可以利用数据集中的领域适应测试模块,评估其在不同领域数据上的泛化能力。通过这些步骤,用户可以全面了解各种TSG方法的性能,并选择最适合其应用场景的方法。
背景与挑战
背景概述
在时间序列分析领域,合成时间序列生成(TSG)技术因其广泛的应用而备受关注,包括数据增强、异常检测和隐私保护等。尽管该领域已取得显著进展,但现有方法仍存在三大局限:缺乏全面的性能比较、依赖专用或私有数据集以及评估指标不明确。为应对这些挑战,新加坡国立大学的研究团队于2023年推出了TSGBench,这是首个时间序列生成基准,旨在为TSG方法提供统一且全面的评估平台。TSGBench包含三个核心模块:精选的公开真实世界数据集、标准化的预处理流程、以及全面的评估指标套件,包括新的基于距离的评估和可视化工具。该基准的推出,标志着时间序列生成领域迈向了标准化和系统化评估的新阶段。
当前挑战
TSGBench在构建和应用过程中面临多重挑战。首先,现有方法在性能比较时往往局限于同类模型,缺乏跨模型的全面评估,这限制了对TSG方法性能的深入理解。其次,数据集的选择和预处理过程中存在偏差,使用私有或合成数据集可能导致评估结果的泛化能力不足。此外,评估指标的不明确性,特别是与定制网络或下游任务紧密相关的指标,阻碍了方法间的公平比较。为应对这些挑战,TSGBench通过引入公开数据集、标准化预处理流程和多样化的评估指标,力求提供一个公正且全面的评估框架。
常用场景
经典使用场景
在时间序列生成的众多应用中,TSGBench数据集尤为经典地应用于数据增强、异常检测和隐私保护等领域。其核心在于通过生成与原始时间序列相似的新序列,保留时间依赖性和维度相关性,从而确保生成的序列在分类和预测等下游任务中具有实际效用。
实际应用
在实际应用中,TSGBench数据集被广泛用于需要高质量合成时间序列的场景,如金融市场的预测、医疗数据的隐私保护和工业设备的预测性维护。其生成的合成数据不仅能够增强现有数据集,还能在数据稀缺的情况下提供有效的训练数据,从而提升模型的泛化能力和预测精度。
衍生相关工作
基于TSGBench数据集,衍生了一系列经典工作,包括但不限于时间序列生成模型的改进、新的评估指标的提出以及跨领域适应性测试的探索。这些工作不仅推动了时间序列生成技术的发展,还为相关领域的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



