five

FlowBench

收藏
arXiv2025-03-22 更新2025-03-25 收录
下载链接:
https://huggingface.co/datasets/BGLab/FlowBench/tree/main/LDC_NS_3D
下载链接
链接失效反馈
官方服务:
资源简介:
FlowBench数据集是由BGLab创建的高保真3D CFD模拟数据集,包含1000个模拟,涵盖从10到1000的雷诺数。数据集采用符号距离函数(SDF)表示几何形状,并以128×128×128的分辨率提供5D numpy tensors作为输入和输出。该数据集旨在用于评估和改进科学机器学习模型,特别是那些用于复杂3D几何体流动模拟的模型。

The FlowBench dataset is a high-fidelity 3D CFD simulation dataset created by BGLab. It includes 1000 simulations with Reynolds numbers ranging from 10 to 1000. The dataset uses the signed distance function (SDF) to represent geometric shapes, and provides 5-dimensional NumPy tensors at a resolution of 128×128×128 as both inputs and outputs. This dataset is designed for evaluating and improving scientific machine learning models, especially those intended for flow simulations on complex 3D geometries.
提供机构:
暂无
创建时间:
2025-03-22
搜集汇总
数据集介绍
main_image_url
构建方式
FlowBench数据集通过高保真三维计算流体动力学(CFD)模拟构建,覆盖了从10到1,000的雷诺数范围,包含1,000个模拟样本。数据生成采用经过验证的Navier-Stokes框架,结合位移边界法处理复杂几何边界条件。数据集通过八叉树网格进行局部细化,确保在几何边界附近的高分辨率捕捉。所有数据统一降采样至128×128×128的空间分辨率,并以NumPy压缩格式存储,便于机器学习模型的直接使用。
使用方法
FlowBench数据集以标准化格式存储,包含输入张量(SDF和雷诺数)和输出张量(速度分量u、v、w和压力p),可直接集成到深度学习框架中。用户可通过加载.npz文件快速访问数据,并利用内置的几何和流动条件进行模型训练与验证。数据集特别适用于评估科学机器学习模型(如DeepONet及其变体)在三维复杂流动预测中的性能,支持从全局流场精度到边界层梯度的一致性分析。
背景与挑战
背景概述
FlowBench是由Baskar Ganapathysubramanian团队于2024年提出的三维流体动力学基准数据集,旨在推动科学机器学习(SciML)在复杂几何体绕流模拟中的应用。该数据集包含1,000组高保真CFD模拟结果,覆盖雷诺数10-1,000的稳态流动工况,涉及100种参数化几何体(包括圆柱体、环状体、椭球体等)。作为首个系统整合符号距离函数(SDF)几何表征与多雷诺数流动条件的三维基准,FlowBench通过HuggingFace平台开源,为神经算子架构验证提供了标准化测试环境,显著促进了三维流场预测模型的开发与评估。
当前挑战
在领域问题层面,FlowBench致力于解决三维复杂几何绕流的高效预测难题,其核心挑战在于:1) 三维边界层效应与湍流结构的精确建模;2) 跨雷诺数流动条件的泛化能力缺失;3) 传统CFD方法在实时优化场景中的计算瓶颈。在数据集构建过程中,研究团队面临:1) 高分辨率三维流场数据的存储与处理效率问题;2) 几何参数化与SDF表征的数学一致性保障;3) 物理约束(如质量守恒)在离散化过程中的数值保真度维持。这些挑战通过自适应八叉树网格和移位边界法等创新技术得到部分缓解。
常用场景
经典使用场景
FlowBench数据集在计算流体动力学(CFD)和科学机器学习(SciML)领域具有广泛的应用价值。该数据集通过提供1000个高保真度的三维流场模拟数据,覆盖了雷诺数从10到1000的不同流动状态,为研究人员提供了一个全面的基准测试平台。其经典使用场景包括训练和评估神经网络算子(如DeepONet和Geometric-DeepONet)在复杂几何体周围的流场预测能力。通过结合符号距离函数(SDF)和导数约束,该数据集能够有效捕捉边界层效应和流场梯度,从而提升模型的预测精度和泛化能力。
解决学术问题
FlowBench数据集解决了计算流体动力学中高保真度模拟计算成本高昂的难题。传统CFD方法在复杂几何体和大规模三维流场模拟中需要大量计算资源,限制了其在实时设计和优化中的应用。该数据集通过提供预计算的流场数据,支持科学机器学习模型的训练,显著降低了计算成本。此外,数据集的设计还解决了模型泛化问题,通过随机和推断两种训练-测试分割策略,评估模型在已知和未知流动条件下的表现,为研究流动现象的物理一致性和边界层精度提供了重要工具。
实际应用
FlowBench数据集在实际工程应用中具有重要价值,特别是在空气动力学优化、生物医学设备设计和工业流体处理等领域。例如,在飞机翼型设计中,该数据集可以用于快速预测不同几何形状和流动条件下的阻力特性,从而加速设计迭代过程。在生物医学领域,它可以模拟患者特异性血管植入物的血流动力学性能,为医疗器械的优化提供数据支持。此外,数据集的高保真度模拟结果还可用于工业流程控制中的实时反馈和不确定性量化,显著提升工程设计的效率和可靠性。
数据集最近研究
最新研究方向
FlowBench数据集在计算流体力学(CFD)与科学机器学习(SciML)交叉领域的前沿研究中展现出重要价值。近期研究聚焦于三维复杂几何体绕流的神经网络代理建模,通过融合符号距离函数(SDF)的几何感知算子网络(Geometric-DeepONet)和基于导数约束的物理增强训练策略,显著提升了高雷诺数流场的预测精度。该数据集支撑的关键突破包括:在边界层区域实现32%的精度提升,通过梯度惩罚项使外推场景下的导数预测误差降低45%,为航空器气动优化和生物医学器械设计等工程应用提供了高效的计算范式。相关成果正推动神经算子架构从二维向三维复杂流动的范式迁移,同时促进了物理约束损失函数设计与几何表征方法的创新。
相关研究论文
  • 1
    3D Neural Operator-Based Flow Surrogates around 3D geometries: Signed Distance Functions and Derivative Constraints暂无 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作