five

dysts

收藏
arXiv2023-01-29 更新2024-06-21 收录
下载链接:
https://github.com/williamgilpin/dysts
下载链接
链接失效反馈
官方服务:
资源简介:
dysts数据集是一个不断增长的混沌动力系统数据库,目前包含131个已知的混沌动力系统,这些系统跨越了天体物理学、气候学、生物化学等多个领域。每个系统都与预先计算的多变量和单变量时间序列配对。数据集的规模与现有的静态时间序列数据库相当,但我们的系统可以通过重新积分来生成任意长度和粒度的新数据集。数据集中的每个系统都注释有已知的数学属性,并进行了特征分析,以广泛分类集合中存在的不同动态。混沌系统本质上是挑战预测模型的,我们在广泛的基准测试中将预测性能与混沌程度相关联。此外,我们还利用数据集独特的生成特性进行了几个概念验证实验:代理转移学习以改善时间序列分类,重要性抽样以加速模型训练,以及基准符号回归算法。

The Dysts dataset is a growing database of chaotic dynamical systems. It currently contains 131 known chaotic dynamical systems spanning multiple disciplines including astrophysics, climatology, biochemistry, and other fields. Each system is paired with precomputed multivariate and univariate time series. The scale of this dataset is comparable to that of existing static time series databases, but it can generate new datasets of arbitrary length and granularity through numerical re-integration. Every system in the dataset is annotated with its known mathematical properties and subjected to feature analysis to broadly categorize the distinct dynamics present in the collection. Chaotic systems inherently pose challenges to predictive models, and we correlated prediction performance with the degree of chaos across extensive benchmark tests. Furthermore, we leveraged the unique generative capabilities of this dataset to conduct several proof-of-concept experiments: surrogate transfer learning to improve time series classification, importance sampling to accelerate model training, and benchmarking of symbolic regression algorithms.
提供机构:
德克萨斯大学奥斯汀分校物理与奥登研究所
创建时间:
2021-10-11
搜集汇总
数据集介绍
main_image_url
构建方式
在混沌系统研究领域,DYSTS数据集通过系统化收集与重构131个已发表的低维混沌动力系统构建而成。每个系统均源自天体物理学、气候学、生物化学等领域的经典文献,并经过手动验证与复现,确保其动力学行为符合混沌的数学定义。数据集不仅包含每个系统的显式解析形式、默认初始条件和预计算的多变量与单变量时间序列,还通过相位替代显著性测试确定了最优积分时间步长与主导时间尺度,从而实现了跨系统的时间尺度对齐。此外,每个系统均提供了16种不同配置的预计算轨迹,涵盖粗细采样粒度、训练测试分割、多变量与单变量视图以及有无布朗噪声等组合,为时间序列分析提供了高度标准化的基准环境。
使用方法
DYSTS数据集适用于时间序列预测、数据驱动建模及迁移学习等多种任务。在预测任务中,用户可利用预计算的训练轨迹评估不同模型(如深度学习、统计方法)的长期预测性能,并通过测试轨迹验证模型泛化能力。对于数据驱动建模,数据集提供了符号回归任务所需的轨迹与时间导数数据,支持对系统动力学方程的推断。在迁移学习场景中,数据集的时间尺度可调性允许生成与目标问题主导时间尺度匹配的代理数据,用于预训练特征提取器以提升分类性能。此外,通过重要性采样等技术,可利用数据集的生成特性加速模型训练或进行控制算法测试。
背景与挑战
背景概述
混沌系统以其内在的复杂性和确定性非重复性,为时间序列分析与数据驱动建模提供了独特的基准测试平台。DYSTS数据集由William Gilpin等人于2023年正式提出,收录了来自天体物理学、气候学、生物化学等领域的131个已知低维混沌动力系统。该数据集不仅包含预计算的多变量与单变量时间序列,还允许通过重新积分生成任意长度与粒度的新数据,从而弥补了传统静态时间序列数据库在可控性与可解释性方面的不足。其核心研究问题在于利用混沌系统的数学可量化特性,如李雅普诺夫指数与分形维数,为预测模型与符号回归等任务提供机理性的性能评估框架,显著提升了时间序列算法的可解释性与泛化能力。
当前挑战
DYSTS数据集旨在解决混沌系统预测与建模的领域挑战,其核心问题在于如何准确量化并利用混沌系统的数学特性来评估与改进时间序列分析模型。具体而言,数据集构建过程中面临多重挑战:首先,混沌系统的低维奇怪吸引子具有非均匀测度与分形结构,导致时间序列采样与特征提取极为复杂;其次,为确保数据集的标准化与可重复性,需手动验证每个系统的混沌动力学,并基于相位替代测试对齐所有系统的时间尺度与采样粒度,这一过程计算密集且依赖精确的初始条件与参数设置。此外,数据集的扩展受限于已发表系统的可用性与实现一致性,需持续的人工策展以维持质量与多样性。
常用场景
经典使用场景
在非线性动力学与时间序列分析领域,DYSTS数据集为评估预测模型的性能提供了标准化的基准平台。该数据集汇集了来自天体物理学、气候学、生物化学等多个学科的131个已知混沌动力系统,每个系统均提供预计算的多变量与单变量时间序列。其经典应用场景在于系统性地检验各类预测算法——包括深度学习模型、统计方法及经典基线模型——在具有严格数学定义的混沌吸引子上的泛化能力与稳定性。通过在不同混沌程度、不同采样粒度以及有无噪声干扰的条件下进行大规模基准测试,研究者能够深入探究模型对复杂动力学模式的捕捉能力,从而推动时间序列预测技术的理论发展与方法创新。
解决学术问题
DYSTS数据集有效解决了混沌系统作为基准测试时缺乏标准化与多样性的核心学术问题。传统研究往往依赖于洛伦兹吸引子等单一系统,难以全面评估算法在不同动力学机制下的普适性。该数据集通过整合大量已知混沌系统,并标注其李雅普诺夫指数、关联维数、多尺度熵等关键数学特性,使得研究者能够定量分析模型性能与系统内在混沌程度之间的关联。例如,实验证实预测误差与最大李雅普诺夫指数存在显著相关性,这为理解模型在混沌环境中的可预测性边界提供了实证依据。此外,数据集的可再生性与可扩展性为符号回归、神经常微分方程等数据驱动建模任务提供了可控且可解释的评估环境。
实际应用
在实际应用层面,DYSTS数据集展现了其作为生成式基准的独特价值。通过时间尺度匹配的替代数据生成,该数据集能够用于迁移学习,提升现实世界时间序列分类任务的性能。例如,在UCR时间序列分类基准测试中,利用混沌系统生成的、与目标数据主导时间尺度匹配的替代集合进行预训练,能够显著提高分类器的准确率。此外,数据集的再生能力支持重要性采样等训练加速技术,通过有针对性地对吸引子稀疏区域进行过采样,可以高效提升预测模型的收敛速度与精度。这些应用表明,DYSTS不仅是一个静态的测试集,更是一个能够灵活适应不同下游任务需求的动态数据生成与增强工具。
数据集最近研究
最新研究方向
在混沌动力学系统领域,DYSTS数据集作为可解释性基准,正推动时间序列分析与数据驱动建模的前沿研究。该数据集整合了131个跨天体物理、气候学与生物化学等领域的混沌系统,其生成性特质允许按需重构任意长度与粒度的时序数据,为模型评估提供了高度可控的数学环境。当前研究聚焦于利用混沌系统的内在数学属性(如李雅普诺夫指数与分形维度)解析预测模型的性能关联,并通过重要性采样加速训练、时序匹配的迁移学习增强分类任务,以及符号回归在动力学方程推断中的应用。这些探索不仅深化了混沌系统在算法可解释性方面的价值,也为高维非线性动力学的通用建模开辟了新路径。
相关研究论文
  • 1
    Chaos as an interpretable benchmark for forecasting and data-driven modelling德克萨斯大学奥斯汀分校物理与奥登研究所 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作