ReViT
收藏Hugging Face2026-05-16 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/thuerey-group/ReViT
下载链接
链接失效反馈官方服务:
资源简介:
ReViT数据集是一个专为旋转等变视觉变换器(ReViT)项目设计的基准数据集,用于学习和预测偏微分方程描述的物理系统动态。它包含三个高分辨率数值模拟子集:KF2D(2D Kolmogorov流,模拟二维湍流,数据包含速度场,空间分辨率160×160,训练集50条轨迹各51时间步,测试集30条轨迹各201时间步)、MHD_64(3D磁流体动力学,模拟可压缩理想MHD,数据包含7个物理场如密度和磁场,空间分辨率64×64×64,5条轨迹各100时间步)和P3D(3D周期性通道流,模拟不可压缩湍流,数据包含速度场和压力场,空间分辨率96×96×96,训练数据1条模拟180时间步,测试数据20时间步)。数据集总大小在10GB到100GB之间,采用MIT许可证,旨在为开发旋转等变机器学习模型提供标准化基准,适用于物理信息机器学习、时间序列预测和PDE系统动态研究。
The ReViT dataset is a benchmark dataset designed for the Rotation-Equivariant Vision Transformer (ReViT) project, aimed at learning and predicting the dynamics of physical systems described by partial differential equations. It includes three high-resolution numerical simulation subsets: KF2D (2D Kolmogorov Flow, simulating 2D turbulence with velocity fields, spatial resolution 160×160, training set of 50 trajectories with 51 time steps each, test set of 30 trajectories with 201 time steps each), MHD_64 (3D Magnetohydrodynamics, simulating compressible ideal MHD with 7 physical fields such as density and magnetic fields, spatial resolution 64×64×64, 5 trajectories with 100 time steps each), and P3D (3D Periodic Channel Flow, simulating incompressible turbulence with velocity and pressure fields, spatial resolution 96×96×96, training data from 1 simulation with 180 time steps, test data with 20 time steps). The dataset has a total size between 10GB and 100GB, is released under the MIT license, and serves as a standardized benchmark for developing rotation-equivariant machine learning models, particularly for physics-informed machine learning, time series forecasting, and research on complex PDE system dynamics.
创建时间:
2026-05-15
搜集汇总
数据集介绍

构建方式
ReViT数据集专为旋转等变视觉Transformer在偏微分方程动力学学习中的研究而构建,涵盖二维与三维物理仿真的三个基准子集。KF2D源于APEBench框架,基于不可压缩纳维-斯托克斯方程模拟二维科尔莫戈罗夫流,通过流函数反演将涡度场转换为速度场,生成包含50条训练轨迹与30条测试轨迹的数据,每条轨迹分别记录51和201个时间步的二维速度场。MHD_64取自The Well基准,模拟马赫数0.7与声速马赫数0.5下的可压缩理想磁流体动力学,存储为HDF5格式,包含5条轨迹各100个时间步的密度、速度与磁场三维场量。P3D由直接数值模拟生成,描述三维周期性槽道中的不可压缩湍流,以HDF5格式保存单条模拟轨迹的速度与压力场。
特点
该数据集突出物理仿真数据的旋转等变性,为模型提供多尺度湍流与磁流体动力学场景。KF2D空间分辨率为160×160,包含二维速度场,支持周期性边界条件下的准稳态涡旋动力学研究。MHD_64以64×64×64网格分辨率呈现密度、速度与磁场七个通道的耦合演化,具有周期性边界条件,体现压缩性效应与多场交互。P3D具备96×96×96的高空间分辨率,包含三维速度与压力四个通道,模拟高雷诺数下的湍流过程。三个子集覆盖不同维度与物理复杂度,且数据尺寸介于10G至100G之间,为训练大规模旋转等变网络提供了充足的样本量。
使用方法
数据集可通过HuggingFace Hub便捷获取,支持使用snapshot_download或hf_hub_download函数下载完整仓库或指定子集,也可利用ReViT仓库中的下载脚本进行定向获取。KF2D数据以NumPy数组加载,形状为(样本数,时间步,通道,高,宽),便于直接切片处理。MHD_64与P3D采用HDF5格式存储,需通过h5py库读取,其中MHD_64需注意通道重排顺序以匹配模型输入要求。数据加载后,用户可根据任务需求提取不同时间步进行时序预测,或利用周期性边界条件设计旋转等变模型,开展偏微分方程动力学的学习与泛化研究。
背景与挑战
背景概述
ReViT数据集由德国慕尼黑工业大学Thuerey研究组于2025年创建,旨在为旋转等变视觉Transformer在偏微分方程动力学学习中的应用提供标准化基准。该数据集聚焦于流体力学与磁流体动力学领域,包含三个高保真物理仿真子集:二维Kolmogorov湍流、三维磁流体动力学以及三维周期性通道湍流。通过提供原始速度场、压力场及磁场等多通道物理量序列,ReViT填补了兼具物理对称性与高分辨率特性的时序数据集的空白,为等变神经网络在复杂物理系统模拟中的泛化能力评估奠定了重要基础。
当前挑战
该数据集所解决的领域挑战在于,传统数值方法求解纳维-斯托克斯及磁流体方程的计算成本高昂,而现有数据驱动模型常忽视物理场的旋转对称性,导致在非对齐数据上的预测精度陡降。构建过程中面临三重困难:首先需从涡量场反演速度场并保持守恒性;其次需统一坐标变换规则以实现跨数据集等变训练;最后需在64³至96³网格规模下保持长时间序列的物理保真度,同时规避HDF5格式下海量张量的边界错位与归一化偏差问题。
常用场景
经典使用场景
ReViT数据集专为基于旋转等变视觉Transformer的偏微分方程动力学学习而设计,在物理仿真与深度学习交叉领域扮演着基准测试的角色。该数据集涵盖三个经典湍流模拟场景:二维Kolmogorov流动的不可压缩Navier-Stokes方程解、三维可压缩磁流体动力学演化、以及三维周期性管道中的直接数值模拟湍流。研究者利用这些高保真时空轨迹数据,系统评估物理信息驱动模型在预测复杂流体行为时的旋转等变能力,尤其关注模型在周期性边界条件下对速度、压力及磁场等矢量场特征的旋转变换鲁棒性,成为验证神经算子与Transformer架构在物理动力学任务中泛化性能的核心测试平台。
实际应用
ReViT数据集的实际应用场景集中于计算流体力学的高效替代建模领域。在航空航天工程中,基于该数据集训练的旋转等变Transformer可加速飞行器绕流场的大规模数值模拟,将传统小时级的直接数值仿真缩短至秒级推理。在气候系统建模中,该数据集训练的模型能够精准预测大气湍流演变,为灾害性天气预警提供快速响应方案。此外,在核聚变反应堆设计中,磁流体动力学数据的应用使得对等离子体约束行为的实时预测成为可能,大幅降低了基于耗时的第一性原理模拟的迭代成本,展现了深度学习在工业级物理仿真中的替代潜力。
衍生相关工作
ReViT数据集衍生了一系列围绕等变架构与物理动力学融合的经典工作。其构建方法启发了后续研究将李群等变理论引入视觉Transformer设计,催生了诸如SE(3)-Transformer在流体不可压缩性约束下的改进版本。在神经算子领域,研究者基于该数据集提出了Fourier等变神经算子,通过频谱域旋转对齐显著提升长程预测精度。此外,该数据集还促使科学家发展了跨场景迁移学习框架,利用KF2D的二维知识预训练模型,再微调至MHD_64的三维磁流体系统,验证了等变特征在物理维度泛化中的关键作用,开拓了多尺度物理场联合建模的新方向。
以上内容由遇见数据集搜集并总结生成



