BubbleML_2
收藏Hugging Face2025-05-22 更新2025-05-23 收录
下载链接:
https://huggingface.co/datasets/hpcforge/BubbleML_2
下载链接
链接失效反馈官方服务:
资源简介:
BubbleML 2.0是一个包含FC-72、液氮和R515B三种流体二维沸腾模拟的高保真数据集。该数据集提供了配对的时间序列场,存储在HDF5文件中,并伴有元数据JSON文件和明确的训练/测试数据划分。
BubbleML 2.0 is a high-fidelity dataset containing two-dimensional boiling simulations for three fluids: FC-72, liquid nitrogen, and R515B. This dataset provides paired time-series fields stored in HDF5 files, accompanied by metadata JSON files and an explicit train/test data split.
创建时间:
2025-05-20
原始信息汇总
BubbleML 2.0 数据集概述
基本信息
- 许可证: CC-BY-4.0
- 数据集名称: BubbleML_2
- 数据类型: 高保真沸腾模拟数据(2D)
- 包含流体: FC-72、Liquid N2、R515B
- 数据格式: HDF5 (.hdf5) 文件与元数据 (.json) 配对
- 数据划分: 明确的训练/测试集划分
数据集子集
- single-bubble: 单气泡任务
- pb-saturated: 饱和池沸腾任务
- pb-subcooled: 过冷池沸腾任务
- fb-velscale: 流动沸腾-变入口速度任务
- fb-chf: 流动沸腾-变热通量任务
数据结构
每个数据示例包含以下字段:
- input:
- 形状: (time_window=5, fields=4, HEIGHT, WIDTH)
- 类型: NumPy 数组
- output:
- 形状: (time_window=5, fields=4, HEIGHT, WIDTH)
- 类型: NumPy 数组
- fluid_params:
- 包含9个浮点数的列表,代表以下参数:
- 逆雷诺数
- 无量纲化比热
- 无量纲化粘度
- 无量纲化密度
- 无量纲化热导率
- 斯特凡数
- 普朗特数
- 成核等待时间
- 加热器温度
- 包含9个浮点数的列表,代表以下参数:
- filename:
- HDF5 文件名(例如 Twall_90.hdf5)
快速开始
python from datasets import load_dataset
加载训练集
ds_train = load_dataset( "hpcforge/BubbleML_2", name="single-bubble", split="train", streaming=True, trust_remote_code=True, )
加载测试集
ds_test = load_dataset( "hpcforge/BubbleML_2", name="single-bubble", split="test", streaming=True, trust_remote_code=True, )
搜集汇总
数据集介绍

构建方式
在沸腾传热研究领域,BubbleML_2数据集通过高精度数值模拟方法构建,涵盖FC-72、液态氮与R515B三种流体的二维沸腾过程。该数据集采用分层采样策略,针对单气泡、饱和池沸腾、过冷池沸腾及变流速与变热通量的流动沸腾五种典型工况分别生成独立子集。所有模拟数据以HDF5格式存储时间序列场数据,并配备描述流体物性参数的元数据文件,通过严格的网格独立性验证确保物理场的空间分辨率与时间步长满足科学计算要求。
特点
该数据集最显著的特征在于其多物理场耦合的完整表征,每个样本包含连续五个时间步长的四维物理场数据,覆盖速度、温度、压力等关键变量。不同子集分别对应特定沸腾工况,如单气泡演化过程与临界热通量现象,为研究相变动力学提供系统基准。数据集采用非量纲化参数描述流体特性,包含逆雷诺数、普朗特数等九个特征参数,这种标准化处理使得跨流体类型的对比研究成为可能,同时保持物理场的时空连续性。
使用方法
研究者可通过HuggingFace数据集库直接调用该资源,使用streaming模式加载以优化存储空间。典型应用流程包括指定目标子集名称与数据划分,例如选择single-bubble子集并分别载入训练与测试分割。每个数据样本提供输入输出张量对、流体参数列表及源文件信息,支持端到端的时空预测模型训练。用户可通过修改name参数切换不同沸腾工况,利用流体参数实现跨工况的迁移学习,为沸腾传热的机器学习研究提供标准化实验平台。
背景与挑战
背景概述
沸腾传热作为热力学与流体力学交叉领域的核心课题,其机理研究对能源系统优化与电子设备热管理具有关键意义。BubbleML_2数据集由高性能计算研究团队于2024年构建,聚焦于二维沸腾过程的多物理场仿真,涵盖FC-72、液氮与R515B三种工质。该数据集通过高保真数值模拟捕获气泡动力学与传热特性,为深度学习模型在复杂相变现象预测中的泛化能力评估提供基准平台,显著推进了数据驱动型传热学研究范式的演进。
当前挑战
沸腾传热领域长期面临多尺度物理耦合与非平衡态动力学的建模难题,传统数值方法在界面捕捉与相变预测中存在计算成本高昂的瓶颈。BubbleML_2构建过程中需攻克多相流场数据同步采集的技术障碍,确保温度场、速度场等四类物理量的时空对齐精度。数据集设计还需平衡不同沸腾工况(饱和沸腾、过冷沸腾等)的覆盖广度与数据一致性,其结构化存储方案既要维持HDF5格式的并行读写效率,又需通过元数据标准化支持跨流体参数的对比研究。
常用场景
经典使用场景
在沸腾传热研究领域,BubbleML_2数据集凭借其高保真二维模拟数据,为多相流动力学建模提供了关键支撑。该数据集通过捕捉单气泡演化、饱和与过冷池沸腾等典型工况,成为验证相变传热理论模型的核心基准,尤其在分析气泡成核、生长及脱离过程的时空特性方面具有不可替代的价值。
衍生相关工作
基于该数据集衍生的经典研究包括时序卷积网络在沸腾状态预测中的创新应用,以及物理信息神经网络(PINN)对多相流传热方程的嵌入求解。这些工作通过融合数据驱动与物理约束,不仅提升了沸腾危机的预警能力,更催生了《物理评论流体》等顶级期刊系列关于动态相变建模的理论突破。
数据集最近研究
最新研究方向
在相变传热领域,BubbleML_2数据集凭借其高保真沸腾模拟数据,正推动多相流物理场预测的前沿探索。当前研究聚焦于利用深度学习模型对沸腾过程中的气泡动力学进行时空序列建模,涵盖单泡演化、饱和与过冷池沸腾及变流速流动沸腾等复杂场景。该数据集通过耦合流体参数与热物理场数据,为开发可解释的物理信息神经网络提供了关键支撑,助力突破临界热流密度预测等能源工程难题,显著提升了沸腾传热智能模拟的精度与泛化能力。
以上内容由遇见数据集搜集并总结生成



