ibm-research/hemolab-bench
收藏Hugging Face2026-05-06 更新2026-05-10 收录
下载链接:
https://hf-mirror.com/datasets/ibm-research/hemolab-bench
下载链接
链接失效反馈官方服务:
资源简介:
Hemolab Bench数据集包含参数化的3D CFD表面网格(非结构化网格,三角化),每个样本具有每个顶点的压力和壁面剪切应力(WSS)场。每个样本对应于由17个参数族(曲率、扭曲、锥度、雷诺数、泰勒数)生成的不同几何形状。数据集包含49,660个样本,所有样本共享相同的三角拓扑结构(9,600个三角形,25,600个顶点)。数据集预先分为训练集、验证集和测试集,以确保实验的可重复性。测试集还包括两个分类列(alpha_split和reynold_split),用于指示每个测试样本所属的分布区域,以便进行按区域评估。
A dataset of parameterized 3-D CFD surface meshes (UNSTRUCTURED_GRID, triangulated) with per-vertex pressure and wall shear stress (WSS) fields. Each sample corresponds to a distinct geometry generated from a 17-parameter family (curvature, twist, taper, Reynolds number, Taylor number). The dataset contains 49,660 samples, all sharing the same triangulation topology (9,600 triangles, 25,600 vertices). The dataset ships with pre-built splits (train, validation, test) for reproducible experiments. The test set includes two categorical columns (alpha_split, reynold_split) that indicate which distribution region each test sample belongs to, enabling per-regime evaluation.
提供机构:
ibm-research
搜集汇总
数据集介绍

构建方式
Hemolab Bench数据集构建于计算流体力学(CFD)领域,旨在提供参数化三维表面网格数据。该数据集通过17个参数(包括曲率、扭转、锥度、雷诺数和泰勒数)生成多样化的几何构型。每个样本均采用一致的三角剖分拓扑结构,包含9,600个三角形和25,600个顶点,确保了网格统一性。数据集共包含49,660个样本,每个样本均附带顶点级压力与壁面剪应力(WSS)场。构建过程中,数据被划分为训练集(80%)、验证集(10%)和测试集(10%),划分基于确定性随机打乱,以保证实验的可重复性。测试集额外提供了基于alpha参数和雷诺数的频带标签,便于进行分区域性能评估。
特点
该数据集的核心优势在于其高度参数化的几何生成能力,覆盖了从几何形态到流体动力学参数的广阔空间。所有样本共享一致的网格拓扑,极大便利了基于网格的深度学习模型训练,避免了重网格化带来的误差。每个样本包含完整的顶点坐标、压力标量和WSS矢量场,为三维流体模拟提供了丰富且标准化的监督信号。测试集特有的频带标签(如alpha_split和reynold_split)支持按参数区间进行细粒度评估,尤其适用于外推性分析,全面衡量模型在不同分布区域的泛化性能。
使用方法
部署Hemolab Bench数据集时,用户可通过Hugging Face的datasets库便捷加载:使用load_dataset("ibm-research/hemolab-bench")即可获取完整数据集,并通过split参数指定训练、验证或测试子集。每个样本以字典形式存储,其中points、pressure和wss字段为扁平化数组,需reshape为原始形状(如点云为(25600, 3))。共享的网格拓扑信息存储于独立的topology.parquet文件中,可通过hf://路径读取,确保所有样本的单元连接性一致。此设计使得研究人员能直接专注于神经网络的输入输出映射,无需处理网格预处理,显著降低了使用门槛。
背景与挑战
背景概述
Hemolab-Bench数据集由IBM研究院的研究团队于近年创建,专注于计算流体力学(CFD)领域中的参数化三维表面网格数据。其核心研究问题在于为血管内血流动力学模拟提供标准化的基准数据集,以支持基于深度学习的流体动力学代理模型开发。该数据集包含49,660个样本,每个样本由17个几何参数(如曲率、扭转、锥度、雷诺数和泰勒数)生成,并附带每个顶点的压力与壁面剪切应力(WSS)场。通过统一的三维网格拓扑结构(9,600个三角形单元,25,600个顶点),该数据集为流体动力学中的几何参数化与物理场预测研究提供了高保真度的训练与评估平台,对机器学习驱动的CFD加速方法具有重要推动作用。
当前挑战
该数据集所解决的领域挑战在于从几何参数到三维表面物理场的复杂非线性映射预测,传统CFD方法虽精度高但计算成本巨大,而基于数据驱动的替代模型需处理高维网格数据与稀疏标注的耦合问题。在构建过程中,面临的主要挑战包括:首先,生成大量参数化几何需确保样本空间的充分覆盖性与物理合理性,同时维持网格拓扑的一致性;其次,CFD仿真计算资源消耗极大,需在参数空间内高效生成稳定解;此外,测试集的分区标签设计需体现物理参数的分布特征,以支持对模型泛化能力的细粒度评估,并避免数据划分带来偏见。
常用场景
经典使用场景
在计算流体力学与机器学习交叉领域,Hemolab-Bench数据集为三维血流动力学仿真提供了标准化基准。其核心价值体现在支持从参数化几何族(涵盖17种物理参数如曲率、扭转、雷诺数等)生成的曲面网格上,预测壁面压力与壁面剪切应力(WSS)矢量场。该数据集统一了网格拓扑结构(25,600个顶点、9,600个三角形),使得研究者能够聚焦于物理场学习而非网格适配问题。典型应用包括训练图神经网络或卷积网络处理不规则网格数据,用于端到端的流场预测。
实际应用
该数据集在心血管疾病辅助诊断和手术规划中具有实际应用前景。通过学习壁面剪切应力分布,可辅助识别动脉瘤、狭窄等病变区域的血流动力学异常。此外,其参数化设计支持快速生成个性化血管模型,用于定制化支架植入或搭桥手术的仿真优化。在药物递送研究中,WSS预测有助于理解内皮细胞对流动刺激的反应机制,从而优化靶向给药策略。
衍生相关工作
围绕Hemolab-Bench衍生的经典工作主要集中在利用图神经网络(如MeshGraphNet、PointNet++变体)进行非结构化网格上的物理场回归。研究者探索了基于等变图卷积的旋转不变性建模,以提升对几何参数变化的鲁棒性。此外,该数据集推动了对流固耦合简化模型的研究,通过将三维WSS映射降维至二维表面特征,实现了高效的血流动力学代理模型构建。部分工作还结合物理信息神经网络(PINNs),将纳维-斯托克斯方程作为先验约束融入学习过程。
以上内容由遇见数据集搜集并总结生成



