湍流通道流数据集
收藏arXiv2025-04-29 更新2025-05-13 收录
下载链接:
http://arxiv.org/abs/2504.20858v1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集为湍流通道流数据集,包含14万个快照,是专为机器学习研究湍流系统而设计的。该数据集经过精心处理,以确保一致性和可用性,适用于机器学习研究湍流系统。数据集主要用于预测和建模湍流系统的长期行为,为气象预报、气候模型和湍流流体的理解提供了重要数据支持。
This is a turbulent channel flow dataset comprising 140,000 snapshots, specifically developed for machine learning research on turbulent systems. It has been meticulously curated to ensure consistency and usability, tailored for such research endeavors. The dataset is primarily employed for predicting and modeling the long-term behavior of turbulent systems, providing critical data support for weather forecasting, climate modeling, and the comprehension of turbulent fluids.
提供机构:
伦敦大学学院
创建时间:
2025-04-29
搜集汇总
数据集介绍

构建方式
湍流通道流数据集的构建基于三维湍流通道流动的高分辨率数值模拟,采用格子玻尔兹曼方法(LBM)结合Smagorinsky亚格子湍流模型,在Reτ=180条件下生成。计算域尺寸为1024×192×192网格点,通过周期性边界条件和无滑移边界条件模拟真实湍流特性。数据采集自完全发展的湍流状态,包含240条训练轨迹、24条验证轨迹和24条测试轨迹,每条轨迹包含595帧速度场快照,最终形成总计14万张二维截面快照的多通道数据集。
使用方法
该数据集适用于湍流预测模型的训练与评估,建议使用滑动窗口策略构建时空样本。输入可设计为连续T帧的速度场,输出为后续Δt时刻的流场演化。评估指标应包含短期预测的相对L2误差和长期统计的能谱匹配误差(ME-APE)、混合率(Δλ)等。特别注意需保持数据归一化的一致性,并利用周期性边界条件进行空间填充。对于Transformer类模型,可采用轴向注意力机制处理二维流场数据,同时建议引入物理约束损失函数以保证统计特性守恒。
背景与挑战
背景概述
湍流通道流数据集是由伦敦大学学院动态系统与统计科学团队于2025年提出的机器学习基准数据集,旨在推动混沌系统长期预测的研究。该数据集包含14万张高分辨率湍流通道流快照,聚焦于解决耗散混沌系统中由正李雅普诺夫指数导致的预测误差指数级放大问题。研究团队基于冯·诺伊曼遍历定理,创新性地将物理先验知识融入Transformer架构,通过改进的注意力机制和酉算子约束,在保持系统遍历性的同时实现了大规模混沌动力学的稳定生成。该数据集作为首个专为机器学习设计的高维湍流基准,为混沌系统建模、气候模拟等应用领域提供了重要的研究基础。
当前挑战
该数据集面临双重挑战:在领域问题层面,需解决高维混沌系统(相空间维度超过10^5)中非高斯统计特性的精确建模,以及由拓扑混合性质导致的局部扰动全局传播问题;在构建过程中,需克服三维湍流模拟产生的超大规模数据(约100TB原始数据)的降维处理难题,包括从直接数值模拟中提取二维截面时的边界条件保持、统计一致性验证,以及将数据规模压缩三个数量级至100GB级别的工程挑战。此外,数据生成需平衡Lattice Boltzmann方法中Smagorinsky亚网格模型参数化与真实湍流特征的保真度,这对机器学习模型的泛化能力提出了严格要求。
常用场景
经典使用场景
湍流通道流数据集在流体动力学和混沌系统研究中具有重要应用价值。该数据集通过高分辨率的湍流通道流模拟数据,为研究者提供了一个可靠的基准测试平台。其经典使用场景包括研究湍流的时空演化特性、验证新型机器学习模型在混沌系统预测中的性能,以及探索湍流中的能量传递和耗散机制。数据集包含14万张湍流通道流的快照,覆盖了从层流到充分发展湍流的完整过渡过程,为研究湍流的复杂动力学行为提供了丰富的数据支持。
解决学术问题
该数据集有效解决了混沌系统长期预测中的关键学术问题。针对混沌系统固有的正李雅普诺夫指数导致预测误差指数级放大的难题,数据集通过提供高分辨率、长时间跨度的湍流演化数据,支持研究者开发能够保持系统遍历性的预测模型。数据集特别关注了湍流中的统计特性保持问题,为验证新型Transformer架构在保持长期统计特性方面的性能提供了基准。通过该数据集,研究者可以定量评估模型在短期预测精度和长期统计一致性两个关键指标上的表现,推动了混沌系统预测方法的理论发展。
实际应用
在实际应用方面,湍流通道流数据集为多个工程领域提供了重要支持。在航空航天领域,该数据集可用于优化飞行器表面湍流控制策略;在能源领域,支持风力发电机叶片周围的湍流特性研究;在环境工程中,有助于大气边界层湍流扩散的模拟。此外,数据集还为计算流体力学软件的验证提供了高标准测试案例,促进了工业级湍流模拟精度的提升。基于该数据集开发的预测模型,可显著降低传统高保真湍流模拟的计算成本,为实时湍流控制和优化提供了可能。
数据集最近研究
最新研究方向
在湍流通道流数据集的研究中,最新的研究方向聚焦于利用基于Transformer的框架来预测大规模混沌系统的长期动态行为。这一研究通过引入改进的注意力机制和随机傅里叶位置编码,有效地捕捉了混沌系统的拓扑混合特性和极端行为。此外,基于冯·诺依曼遍历定理的新型损失函数确保了长期统计特性的保持,从而在短期预测精度和长期统计一致性方面均取得了显著提升。该数据集在机器学习研究中的应用,特别是在高维和高分辨率混沌系统建模方面,展现了重要的科学价值和实际意义。
相关研究论文
- 1Chaos Meets Attention: Transformers for Large-Scale Dynamical Prediction伦敦大学学院 · 2025年
以上内容由遇见数据集搜集并总结生成



