NACA_4_Digit_for_ML
收藏Hugging Face2026-05-11 更新2026-05-14 收录
下载链接:
https://huggingface.co/datasets/Kokoslocke/NACA_4_Digit_for_ML
下载链接
链接失效反馈官方服务:
资源简介:
NACA 4-Digit Airfoil CFD Dataset是一个用于机器学习应用的空气动力学计算流体力学(CFD)数据集。它包含约500个收敛的CFD模拟案例,覆盖50种不同的NACA 4位数翼型剖面,每个案例代表在特定流动条件下围绕翼型的稳态湍流流动。数据生成使用OpenFOAM v13求解器配合k-ω SST湍流模型,采用C型网格拓扑结构。参数空间包括最大弯度(0-6%弦长)、弯度位置(20-60%弦长)、厚度(8-18%弦长)、攻角(-5°至+5°)和雷诺数(100,000-500,000)。数据集还包含10个分布外(OOD)测试案例,使用更高的雷诺数和攻角,用于评估模型的泛化能力。每个案例存储为压缩的NumPy存档文件(.npz),包含空间坐标、符号距离函数、初始速度场、求解的速度分量、运动学压力、湍流动能、比耗散率、湍流粘度、雷诺数和壁面相邻单元标识等字段。空间域经过归一化处理,前缘位于x=0,后缘位于x=1,边界框范围为x∈[-1.5, 3.5],y∈[-1.5, 1.5]。数据集采用基于翼型剖面的划分策略,确保同一翼型的所有案例属于同一划分(训练、验证或测试),具体划分为约348个训练案例(35种翼型)、约80个验证案例(8种翼型)、约70个测试案例(7种翼型)以及10个OOD测试案例。该数据集适用于训练代理模型,以从翼型几何形状和流动条件预测稳态流场,可用于空气动力学优化、流动特性分析等物理机器学习任务。
The NACA 4-Digit Airfoil CFD Dataset is a computational fluid dynamics (CFD) dataset for aerodynamic machine learning applications. It contains approximately 500 converged CFD simulation cases covering 50 different NACA 4-digit airfoil profiles, each representing steady-state turbulent flow around an airfoil under specific flow conditions. Data generation uses the OpenFOAM v13 solver with the k-ω SST turbulence model and a C-type mesh topology. The parameter space includes maximum camber (0-6% chord), camber location (20-60% chord), thickness (8-18% chord), angle of attack (-5° to +5°), and Reynolds number (100,000-500,000). The dataset also includes 10 out-of-distribution (OOD) test cases with higher Reynolds numbers and angles of attack for evaluating model generalization. Each case is stored as a compressed NumPy archive (.npz) containing fields such as spatial coordinates (x, y), signed distance function to the airfoil surface (sdf), initial velocity fields (u_init, v_init), solved velocity components (u, v), kinematic pressure (p), turbulent kinetic energy (k), specific dissipation rate (omega), turbulent viscosity (nut), Reynolds number (scalar), and wall-adjacent cell identifier (is_wall). The spatial domain is normalized with the leading edge at x=0, trailing edge at x=1, and a bounding box range of x∈[-1.5, 3.5], y∈[-1.5, 1.5]. The dataset employs an airfoil-profile-based splitting strategy to ensure all cases of the same airfoil belong to the same split (training, validation, or test), preventing geometric information leakage. Specifically, it is split into approximately 348 training cases (35 airfoils), 80 validation cases (8 airfoils), 70 test cases (7 airfoils), and 10 OOD test cases. The dataset is suitable for training surrogate models to predict steady-state flow fields from airfoil geometry and flow conditions, applicable to physical machine learning tasks such as aerodynamic optimization and flow property analysis.
创建时间:
2026-05-08
搜集汇总
数据集介绍

构建方式
该数据集基于开源CFD工具箱OpenFOAM v13,采用稳态RANS求解器simpleFoam与k-ω SST湍流模型,针对50种独特的NACA 4位数翼型生成点云格式的流场解。计算域采用与攻角对齐的C型网格并附加尾迹加密,弦长归一化为1米。网格坐标范围涵盖翼型上游1.5倍弦长至下游2.5倍弦长,垂直方向各延伸1.5倍弦长。每个算例收敛后,将网格单元中心坐标、流场变量(速度分量、压力、湍动能、比耗散率、涡粘系数)、符号距离函数及壁面标识符等存储为压缩的NumPy数组文件(.npz格式)。数据集共包含约500个收敛算例,参数空间覆盖最大弯度0-6%弦长、弯度位置20-60%弦长、厚度8-18%弦长、攻角-5°至+5°以及雷诺数100,000至500,000,运动粘度固定为1e-5 m²/s。
使用方法
数据集适合用于训练替代模型(surrogate model),以从翼型几何和来流条件预测稳态流场。使用时可通过Python的NumPy库直接加载.npz文件,利用键名(如'x'、'y'、'u'、'v'、'p'、'k'、'omega'、'nut'、'sdf'、'is_wall'等)提取对应数组。配套的metadata.csv文件提供了每个算例的详细工况参数(攻角、雷诺数、入口速度分量与幅值)以及升力系数与阻力系数,便于与流场数据联合分析。数据集的文件命名规则为'NACA{四位数代码}{正负号}{攻角数值}_{雷诺数}.npz',方便根据文件名快速索引算例条件。用户可基于该数据集构建输入为翼型参数(如四位数编码、攻角、雷诺数)与空间坐标、输出为流场物理量的端到端神经网络模型。
背景与挑战
背景概述
计算流体力学(CFD)正朝着与机器学习相融合的方向演进,以突破传统数值模拟在高维参数空间中计算效率的瓶颈。在此背景下,NACA_4_Digit_for_ML数据集应运而生,由研究团队基于OpenFOAM v13平台,采用k-ω SST湍流模型对NACA四位数翼型进行稳态RANS求解而构建。该数据集创建于近年,旨在为翼型几何与来流条件下稳态流场的代理模型训练提供标准化的点云格式基准数据。其覆盖50种不同翼型剖面、约500个收敛案例,并设定了10个极端工况外分布探针案例以评估模型泛化能力。该数据集采用剖面级别的划分策略,有效防止几何信息泄露,为物理信息驱动下的机器学习在气动外形优化与流场快速预测领域提供了关键数据支撑,推动了降阶模型与数据驱动流体力学的发展。
当前挑战
该数据集致力于解决气动外形设计中传统CFD计算成本高昂与代理模型训练数据匮乏之间的核心矛盾。其首先面临流场数据从非结构化网格到机器学习友好格式的转化挑战,包含网格拓扑适应性、变量空间一致性及大规模点云数据的高效存取问题。其次,翼型参数耦合高度非线性:弯度、厚度、攻角与雷诺数共同作用导致流场结构剧变,模型需同时捕捉附着流、分离流及湍流效应。在构建过程中,CFD求解器迭代收敛的可靠性成为瓶颈,非收敛案例被严格剔除以保证数据质量。此外,训练集与测试集按翼型形状隔离,迫使模型学习几何参数与流场间的物理映射关系而非记忆特定形状,从而对代理模型的物理外推性能提出更高要求。
常用场景
经典使用场景
NACA_4_Digit_for_ML数据集作为翼型流场分析的基石,在计算流体力学与机器学习的交叉领域中扮演着关键角色。经典使用场景聚焦于训练代理模型,以高效预测NACA四位数字翼型在给定几何参数与流动条件下的稳态流场。该数据集提供了约500个收敛算例,涵盖50种不同翼型剖面,攻角范围为−5°至+5°,雷诺数介于10万至50万之间,为构建点云格式的流场代理模型提供了高质量的监督学习数据。研究者可基于该数据,从翼型几何与流动边界条件直接映射出速度场、压力场以及湍流特性,显著加速传统CFD仿真流程。
解决学术问题
该数据集在学术领域主要解决了翼型气动性能快速评估的难题,尤其是在设计空间探索与多目标优化场景下表现出独特价值。通过提供几何参数到流场的高保真映射基准,NACA_4_Digit_for_ML有效缓解了传统CFD计算成本高昂、迭代周期长等瓶颈。它对机器学习模型泛化能力的验证具有里程碑意义,其剖分策略基于翼型形状进行划分,确保训练、验证与测试集之间无几何信息泄漏,从而能够严谨评估模型对未见翼型的预测能力。此外,数据集特意纳入10个极端工况测试样本,为探索模型外推性能及鲁棒性奠定了坚实基础。
实际应用
NACA_4_Digit_for_ML数据集的构建紧贴工程实践需求,其研究成果可无缝对接飞行器初步设计与叶轮机械气动优化等现实场景。在航空航天领域,基于该数据集训练的代理模型能够迅速响应设计参数调整,实时输出翼型流场分布与气动系数,大幅缩短选型阶段的计算周期。风能产业中,风力机叶片翼型的气动特性可借助此数据集进行快速评估,助力叶片截面设计与改型迭代。自动驾驶与无人机领域,低雷诺数翼型的气动预测同样受益于该数据支撑,从而提升多工况下的飞行安全性与能耗效率。
数据集最近研究
最新研究方向
该数据集聚焦于利用计算流体力学(CFD)数据驱动翼型流场建模的前沿方向。随着物理信息机器学习(Physics-ML)的兴起,传统依赖高保真数值模拟的流动分析正被数据驱动替代模型所革新。NACA_4_Digit_for_ML通过提供基于OpenFOAM v13生成的稳态RANS点云解,为训练能够从几何与来流条件直接预测速度场、压力场及湍流量的代理模型提供了基准。其设计巧妙之处在于轮廓级别的划分策略,有效防止了几何信息泄露,确保了模型泛化能力评估的严谨性。尤为引人注目的是,数据集包含了高雷诺数(高达~3×10⁷)与大攻角(~17°)下的分布外探测用例,这直接呼应了当前亟需突破CFD替代模型在外插工况下可靠性瓶颈的热点需求。该资源独立于任何特定模型框架,为发展可推广至极端飞行条件的物理感知神经网络架构奠定了关键的数据基石。
以上内容由遇见数据集搜集并总结生成



