AhmedML_2samples
收藏Hugging Face2025-12-14 更新2025-12-15 收录
下载链接:
https://huggingface.co/datasets/fabiencasenave/AhmedML_2samples
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个计算流体动力学(CFD)模拟数据集,主要用于物理学习和几何学习。数据集包含多个特征,如网格坐标、单元数据、点数据等,涉及流体力学中的各种参数(如压力、速度、涡量等)。数据集是通过OpenFOAM模拟生成的,并使用PLAID格式进行标准化存储。数据集包含2个样本,总大小为6436997670字节。
创建时间:
2025-12-13
原始信息汇总
AhmedML_2samples 数据集概述
数据集基本信息
- 数据集名称: AhmedML_2samples
- 任务类别: 图机器学习
- 标签: 物理学习、几何学习
- 许可证: CC BY-SA 4.0
- 数据来源: 由 neashton (https://huggingface.co/datasets/neashton/ahmedml) 提供
- DOI: doi:10.57967/hf/5002
- arXiv: arxiv:2407.20801
- 存储后端: Zarr
- PLAID版本: 0.1.10
数据生产信息
- 物理背景: 计算流体动力学 (RANS-LES)
- 模拟器: OpenFOAM
- 类型: 模拟数据
- 脚本说明: 转换为PLAID格式以实现标准化访问;数据内容未更改。
数据集规模与结构
- 总样本数: 2
- 总大小: 6,436,997,670 字节 (约 6.44 GB)
- 下载大小: 6,436,997,670 字节
- 数据集大小: 6,436,997,670 字节
- 拆分: all_samples (包含全部2个样本)
数据特征
数据集包含以下特征,所有特征均为列表类型:
全局参数 (Global)
Global__body-height: 浮点数列表 (float32)Global__body-length: 浮点数列表 (float32)Global__body-width: 浮点数列表 (float32)Global__cd: 浮点数列表 (float32)Global__cd_varref: 浮点数列表 (float32)Global__cl: 浮点数列表 (float32)Global__cl_varref: 浮点数列表 (float32)Global__front-arc-diameter: 浮点数列表 (float32)Global__slant-angle-degrees: 浮点数列表 (float32)Global__slant-angle-height: 浮点数列表 (float32)Global__slant-angle-length: 浮点数列表 (float32)Global__slant-surface-length: 浮点数列表 (float32)
Base_2_3__Zone 区域
Base_2_3__Zone: 整数列表的列表 (int64)Base_2_3__Zone__CellData__pMean: 浮点数列表 (float32)Base_2_3__Zone__CellData__static(p)_coeffMean: 浮点数列表 (float32)Base_2_3__Zone__CellData__wallShearStressMean_0: 浮点数列表 (float32)Base_2_3__Zone__CellData__wallShearStressMean_1: 浮点数列表 (float32)Base_2_3__Zone__CellData__wallShearStressMean_2: 浮点数列表 (float32)Base_2_3__Zone__CellData__yPlusMean: 浮点数列表 (float32)Base_2_3__Zone__Elements_QUAD_4__ElementConnectivity: 整数列表 (int64)Base_2_3__Zone__Elements_QUAD_4__ElementRange: 整数列表 (int64)Base_2_3__Zone__Elements_TRI_3__ElementConnectivity: 整数列表 (int64)Base_2_3__Zone__Elements_TRI_3__ElementRange: 整数列表 (int64)Base_2_3__Zone__GridCoordinates__CoordinateX: 浮点数列表 (float32)Base_2_3__Zone__GridCoordinates__CoordinateY: 浮点数列表 (float32)Base_2_3__Zone__GridCoordinates__CoordinateZ: 浮点数列表 (float32)
Base_3_3__Zone 区域
单元数据 (CellData)
Base_3_3__Zone__CellData__UMean_0: 浮点数列表 (float32)Base_3_3__Zone__CellData__UMean_1: 浮点数列表 (float32)Base_3_3__Zone__CellData__UMean_2: 浮点数列表 (float32)Base_3_3__Zone__CellData__UPrime2Mean_0: 浮点数列表 (float32)Base_3_3__Zone__CellData__UPrime2Mean_1: 浮点数列表 (float32)Base_3_3__Zone__CellData__UPrime2Mean_2: 浮点数列表 (float32)Base_3_3__Zone__CellData__UPrime2Mean_3: 浮点数列表 (float32)Base_3_3__Zone__CellData__UPrime2Mean_4: 浮点数列表 (float32)Base_3_3__Zone__CellData__UPrime2Mean_5: 浮点数列表 (float32)Base_3_3__Zone__CellData__nutMean: 浮点数列表 (float32)Base_3_3__Zone__CellData__pMean: 浮点数列表 (float32)Base_3_3__Zone__CellData__static(p)_coeffMean: 浮点数列表 (float32)Base_3_3__Zone__CellData__total(p)_coeffMean: 浮点数列表 (float32)Base_3_3__Zone__CellData__vorticityMean_0: 浮点数列表 (float32)Base_3_3__Zone__CellData__vorticityMean_1: 浮点数列表 (float32)Base_3_3__Zone__CellData__vorticityMean_2: 浮点数列表 (float32)
点数据 (PointData)
Base_3_3__Zone__PointData__UMean_0: 浮点数列表 (float32)Base_3_3__Zone__PointData__UMean_1: 浮点数列表 (float32)Base_3_3__Zone__PointData__UMean_2: 浮点数列表 (float32)Base_3_3__Zone__PointData__UPrime2Mean_0: 浮点数列表 (float32)Base_3_3__Zone__PointData__UPrime2Mean_1: 浮点数列表 (float32)Base_3_3__Zone__PointData__UPrime2Mean_2: 浮点数列表 (float32)Base_3_3__Zone__PointData__UPrime2Mean_3: 浮点数列表 (float32)Base_3_3__Zone__PointData__UPrime2Mean_4: 浮点数列表 (float32)Base_3_3__Zone__PointData__UPrime2Mean_5: 浮点数列表 (float32)Base_3_3__Zone__PointData__nutMean: 浮点数列表 (float32)Base_3_3__Zone__PointData__pMean: 浮点数列表 (float32)Base_3_3__Zone__PointData__static(p)_coeffMean: 浮点数列表 (float32)Base_3_3__Zone__PointData__total(p)_coeffMean: 浮点数列表 (float32)Base_3_3__Zone__PointData__vorticityMean_0: 浮点数列表 (float32)Base_3_3__Zone__PointData__vorticityMean_1: 浮点数列表 (float32)Base_3_3__Zone__PointData__vorticityMean_2: 浮点数列表 (float32)
网格元素
Base_3_3__Zone__Elements_HEXA_8__ElementConnectivity: 整数列表 (int64)Base_3_3__Zone__Elements_HEXA_8__ElementRange: 整数列表 (int64)Base_3_3__Zone__Elements_PENTA_6__ElementConnectivity: 整数列表 (int64)Base_3_3__Zone__Elements_PENTA_6__ElementRange: 整数列表 (int64)Base_3_3__Zone__Elements_TETRA_4__ElementConnectivity: 整数列表 (int64)Base_3_3__Zone__Elements_TETRA_4__ElementRange: 整数列表 (int64)
网格坐标
Base_3_3__Zone__GridCoordinates__CoordinateX: 浮点数列表 (float32)Base_3_3__Zone__GridCoordinates__CoordinateY: 浮点数列表 (float32)Base_3_3__Zone__GridCoordinates__CoordinateZ: 浮点数列表 (float32)
数据访问
- 数据集地址: https://huggingface.co/datasets/fabiencasenave/AhmedML_2samples
- 配置名称: default
- 数据文件路径: data/all_samples/*
搜集汇总
数据集介绍

构建方式
在计算流体动力学领域,AhmedML_2samples数据集的构建依托于高保真度的数值模拟技术。该数据集通过OpenFOAM仿真平台,采用雷诺平均纳维-斯托克斯与大涡模拟相结合的混合方法,对Ahmed车身模型的空气动力学特性进行精细模拟。模拟结果经过标准化处理,转换为PLAID格式,确保了数据的结构统一性与可访问性。整个构建过程严格遵循计算流体动力学的科学规范,生成了包含网格坐标、单元连接性以及多种流场物理量的结构化数据,为后续的机器学习建模提供了可靠的基础。
特点
该数据集在几何学习与物理学习任务中展现出显著的专业性特征。其数据结构精心组织,涵盖了二维与三维区域的网格信息,包括四边形、三角形、六面体等多种单元类型,并详细记录了流速、压力、涡量、壁面剪切应力等关键流体力学参数。数据集以Zarr格式存储,支持高效的数据读取与流式传输。每个样本均附带有全局几何参数与气动系数,如升力系数与阻力系数,形成了多尺度、多物理场的完整描述,为复杂流场现象的机器学习研究提供了丰富的特征维度。
使用方法
利用该数据集进行机器学习研究,需借助Plaid库提供的标准化接口。用户可选择将数据集完整下载至本地,或通过流式传输方式直接访问云端数据。初始化后,通过转换器可将原始数据实例化为Plaid样本对象,进而便捷地提取各类输入与输出特征。数据集中预定义的问题描述文件清晰指明了特征路径,研究者可据此遍历不同时间步下的流场数据,灵活构建监督学习或图神经网络模型的训练与验证集,从而高效开展流体力学代理模型或物理信息机器学习模型的开发工作。
背景与挑战
背景概述
AhmedML_2samples数据集诞生于计算流体动力学与机器学习交叉研究蓬勃发展的时代,由neashton研究团队于2024年构建并发布。该数据集依托开源计算流体动力学软件OpenFOAM,采用RANS-LES混合模拟方法,对经典Ahmed车身模型的气动特性进行高保真数值仿真。其核心研究问题聚焦于如何将复杂的流场仿真数据转化为结构化图机器学习任务,旨在推动几何学习与物理信息神经网络在流体力学预测建模中的应用。该数据集的发布为气动外形优化、湍流模型校正等工程问题提供了标准化基准,显著降低了领域专家应用机器学习技术的门槛。
当前挑战
该数据集致力于解决计算流体动力学中高维、非线性流场数据的建模与预测挑战,具体涉及气动力系数、表面压力分布、涡量场等多物理量的精准回归与泛化。构建过程中的主要挑战体现在多尺度物理场的耦合数据采集,需协调四面体、六面体等多种网格单元的结构化表示;同时,原始仿真数据规模庞大,转化为轻量级、可流式访问的PLAID格式时,需在保持数据科学完整性与降低存储开销之间取得平衡。此外,如何将非结构化的空间离散数据有效嵌入图神经网络框架,亦是该数据集试图攻克的关键技术难题。
常用场景
经典使用场景
在计算流体动力学领域,AhmedML_2samples数据集以其结构化的网格与物理场数据,为基于图神经网络的流场预测模型提供了经典范例。该数据集通过包含三维空间坐标、单元连接性以及平均速度、压力、涡量等关键物理量,使得研究者能够构建图结构表示流体域,进而训练模型学习复杂流动现象中的非线性映射关系。这种应用场景特别适用于湍流模拟的降阶建模,能够有效捕捉流体与几何体相互作用时的动态特性。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。例如,基于图神经网络的流场超分辨率重建模型,利用其网格与物理场数据学习从粗网格到细网格的映射。物理约束的生成对抗网络则使用该数据集训练,以合成符合物理规律的湍流场数据。此外,几何深度学习框架通过该数据集的单元连接性信息,发展了适用于非结构网格的等变神经网络,提升了模型对复杂几何的泛化能力,推动了科学机器学习在流体模拟中的实际部署。
数据集最近研究
最新研究方向
在计算流体动力学领域,AhmedML_2samples数据集凭借其精细的湍流模拟数据,正推动基于图神经网络的物理信息学习成为研究热点。该数据集通过PLAID标准化格式,整合了Ahmed车身模型的几何参数与流场变量,为数据驱动的湍流建模提供了高质量基准。前沿研究聚焦于利用该数据集训练几何自适应图神经网络,以预测复杂流动分离现象,从而优化空气动力学设计。这一方向呼应了工业界对高效高精度CFD工具的需求,显著降低了传统模拟的计算成本,对自动驾驶车辆和航空航天工程中的外形优化具有深远影响。
以上内容由遇见数据集搜集并总结生成



