REALM
收藏REALM 数据集概述
数据集基本信息
- 数据集名称:REALM (Realistic AI Learning for Multiphysics)
- 核心目标:为科学机器学习中神经代理模型的评估提供基准,专注于解决当前评估过度依赖简化基准、无法暴露模型在现实多物理场流中局限性的关键空白。
- 主要贡献:包含11个高保真数据集、一个严格的评估协议、对12个以上代表性模型家族的系统性评估,并提出了三个关键发现。
- 相关论文:Benchmarking neural surrogates on realistic spatiotemporal multiphysics flows (arXiv:2506.10862)
- 官方网站:https://realm-bench.org/
- 许可证:MIT License
数据集内容与规模
- 总数据量:约 15 TB
- 数据集数量:11 个高保真数据集
- 网格类型:包含规则网格(2D/3D)和不规则网格
- 网格规模:网格单元数量范围从 2×10⁴ 到 1.2×10⁷
- 物理场变量:每个案例包含 6 到 40 个物理场
- 轨迹数量:每个案例包含多种运行条件下的多条轨迹
- 时间步长:每条轨迹包含 20 到 50 个时间快照
数据集分类与案例
数据集分为四大类别,涵盖从基础问题到复杂应用场景。
1. 经典问题
- IgnitHIT²ᵈ:均匀各向同性湍流中的氢气点火核。
- 域:50×50 mm², 1024×1024 网格。
- 物理:预混火焰传播,湍流-火焰相互作用。
- 轨迹:36条(变化的点火核几何形状和湍流强度)。
- ReactTGV³ᵈ:反应性泰勒-格林涡。
- 域:2π×2π×2π mm³, 256³ 网格。
- 物理:火焰-涡相互作用,熄火/再点燃。
- 轨迹:16条(变化的雷诺数和混合长度)。
2. 高马赫数流动
- PlanarDet²ᵈ:平面胞格爆震。
- 域:200×10 mm², 840×400 网格。
- 物理:激波-反应耦合,胞格结构。
- 轨迹:9条(变化的当量比和温度)。
- PropHIT³ᵈ:湍流中的传播火焰。
- 域:42.4×5.3×5.3 δₗ, 1536×128×128 网格。
- 物理:高压下的湍流预混燃烧。
- 轨迹:8条(变化的压力和湍流强度)。
3. 推进发动机
- SupCavityFlame²ᵈ:超音速凹腔火焰。
- 域:约 3M 不规则网格单元。
- 物理:超燃冲压发动机燃烧,激波-剪切-火焰相互作用。
- 轨迹:9条(变化的喷射速度和位置)。
- SymmCoaxFlame²ᵈ / MultiCoaxFlame³ᵈ:火箭燃烧室。
- 域:295K (2D) / 13.5M (3D) 不规则网格单元。
- 物理:剪切同轴喷射,燃烧室声学。
- 轨迹:12条 (2D), 6条 (3D)(变化的混合比和推力)。
4. 火灾危害
- PoolFire³ᵈ:浮力驱动的池火。
- 域:3×3×3 m³, 80×80×200 网格。
- 物理:羽流动力学,McCaffrey 状态。
- 轨迹:15条(变化的放热率和池尺寸)。
- FacadeFire³ᵈ:建筑立面火灾。
- 域:约 2.5M 不规则网格单元。
- 物理:隔间-立面耦合,外部火焰蔓延。
- 轨迹:9条(变化的放热率)。
数据预处理与训练框架
多尺度预处理
- Box-Cox 变换:将物种的动态范围从 O(10⁻ᵏ) 压缩到 O(1)。
- Z-score 标准化:对所有变量进行一致的标准化。
- 自回归训练:使用短时域展开进行稳定的反向传播。
支持的模型家族
- 谱算子:FNO, FFNO, CROP, DPOT, UNO, LSM
- 卷积模型:CNext
- Transformer 风格:FactFormer, Transolver, ONO, GNOT
- 点态模型:DeepONet, PointNet
- 图/网格网络:MGN, GraphUNet, GraphSAGE
关键基准测试结果
性能趋势总结
- 2D 规则案例:FFNO 和 DPOT 实现了最慢的误差增长;CNext 表现出具有竞争力的性能且伪影最小;Transformer 模型在高分辨率下受内存限制。
- 3D 规则案例:所有模型在保持精细结构方面都存在困难;FFNO 和 DPOT 保持最佳性能;误差累积速度比 2D 案例更快。
- 不规则网格案例:DeepONet 在不规则几何形状中最稳健;图模型容易过度平滑;谱方法在处理非均匀网格时存在困难。
各类别领先模型(基于排行榜)
| 类别 | 最佳模型 | 测试误差 | 相关性 |
|---|---|---|---|
| 2D 规则 | FFNO | 1.87 | 0.973 |
| 3D 规则 | FFNO | 18.45 | 0.896 |
| 2D 不规则 | DeepONet | 29.56 | 0.796 |
| 3D 不规则 | DeepONet | 23.24 | 0.768 |
数据获取与使用
安装与下载
-
克隆仓库: bash git clone https://github.com/deepflame-ai/REALM.git cd REALM pip install -r requirements.txt
-
数据访问:
- 从官方网站 https://realm-bench.org/ 下载。
- 使用脚本下载特定案例或全部数据集: bash python scripts/download_data.py --case IgnitHIT python scripts/download_data.py --all
快速开始示例
python from realm import REALMDataset, REALMTrainer from realm.models import FFNO
加载数据集
dataset = REALMDataset( case="IgnitHIT", split="train", preprocessing="standard" )
初始化模型
model = FFNO( in_channels=12, out_channels=12, modes=(16, 16), width=128 )
训练
trainer = REALMTrainer( model=model, dataset=dataset, rollout_steps=2, max_lr=1e-3 ) trainer.fit()
模型评估
bash python scripts/evaluate.py --case IgnitHIT --model FFNO --checkpoint path/to/checkpoint.pt --metrics all
方法论基础
控制方程
多物理场反应流由以下方程控制:
∂q/∂t + ∇·F(q) - ∇·D(q,∇q) + S(q) = 0
其中:
- q:守恒变量 [ρ, ρu, ρe, ρY₁, ..., ρYₙ]
- F:对流通量
- D:扩散通量
- S:化学源项(刚性 ODEs)
训练协议
- 预处理:对物种进行 Box-Cox 变换 (λ=0.1);对所有场进行 Z-score 标准化。
- 训练:短时域自回归展开;按物理变量类型分组计算损失;使用 OneCycle 学习率调度。
- 评估:全时域自回归展开;评估指标包括 MSE、相关性、SSIM 和推理时间。
引用
如需在研究中使用 REALM,请引用: bibtex @article{mao2025realm, title={Benchmarking neural surrogates on realistic spatiotemporal multiphysics flows}, author={Mao, Runze and Zhang, Rui and Bai, Xuan and others}, journal={arXiv preprint arXiv:2506.10862}, year={2025} }




