five

BubbleML

收藏
arXiv2023-08-25 更新2024-06-21 收录
下载链接:
https://github.com/HPCForge/BubbleML
下载链接
链接失效反馈
官方服务:
资源简介:
BubbleML数据集是由加州大学欧文分校的研究团队创建,专注于多物理场相变现象的研究。该数据集通过物理驱动的模拟生成,提供了多种沸腾场景的准确地面实况信息,包括池沸腾、流动沸腾和过冷沸腾。数据集包含79个模拟,覆盖了广泛参数,如重力条件、流速、过冷水平和壁面过热。这些数据对于开发和比较最先进的机器学习技术和模型至关重要,特别是在热管理和能源效率等关键领域。此外,数据集还提供了两个基准测试场景,用于光学流分析和操作网络学习温度动态,进一步推动了机器学习在多物理场相变现象研究中的应用。

The BubbleML dataset was created by a research team at the University of California, Irvine, focusing on the study of multiphysics phase transition phenomena. Generated via physics-driven simulations, this dataset provides accurate ground-truth information for various boiling scenarios including pool boiling, flow boiling, and subcooled boiling. It contains 79 simulations covering a wide range of parameters such as gravitational conditions, flow velocity, subcooling level, and wall superheat. This dataset is crucial for developing and comparing state-of-the-art machine learning technologies and models, especially in critical fields like thermal management and energy efficiency. Furthermore, the dataset provides two benchmark test scenarios for optical flow analysis and operational network learning of temperature dynamics, further advancing the application of machine learning in the research of multiphysics phase transition phenomena.
提供机构:
加州大学欧文分校
创建时间:
2023-07-27
搜集汇总
数据集介绍
main_image_url
构建方式
在相变现象研究领域,BubbleML数据集通过高保真物理模拟构建,旨在弥补实验数据稀缺的不足。该数据集基于Flash-X模拟框架,采用水平集方法与幽灵流体法精确捕捉液-气界面的动态演化,并融合狄利克雷与诺伊曼混合边界条件以提升物理真实性。模拟涵盖池沸腾、流动沸腾及过冷沸腾等多种场景,通过系统调整重力条件、流速、过冷度与壁面过热度等79组参数,生成涵盖二维与三维域的高分辨率时空数据。所有模拟输出均以HDF5格式存储,并利用BoxKit库进行高效数据管理,确保数据可访问性与计算效率。
使用方法
BubbleML数据集支持多种下游任务,用户可通过提供的PyTorch数据加载器直接访问模拟数据,将其转换为张量格式以用于模型训练。针对光学流分析,数据集可生成气泡轨迹序列,用于训练与微调RAFT、GMFlow等先进光流模型,以捕捉非刚性气泡运动。在科学机器学习方面,数据集适用于训练图像到图像模型(如UNet)与神经算子(如FNO),以学习温度与流速场的演化规律,并可进行自回归推演以预测长期动力学。数据集中包含的物理常数与边界条件参数可作为模型输入,支持物理信息约束的机器学习方法开发。
背景与挑战
背景概述
在相变现象研究领域,机器学习方法的应用因缺乏高质量、多样化的数据集而受到制约。为应对这一挑战,加州大学欧文分校、阿贡国家实验室及韩国大学的研究团队于2023年联合推出了BubbleML数据集。该数据集通过物理驱动的高保真模拟,系统性地捕捉了池沸腾、流动沸腾及过冷沸腾等多种沸腾场景下的气泡动力学与传热过程,涵盖重力条件、流速、过冷度等79组关键参数。其核心目标在于为多物理场相变现象提供精确的基准数据,推动科学机器学习在复杂传热系统建模、优化与控制方面的研究,对能源效率提升、电子设备热管理等工程应用具有深远影响。
当前挑战
BubbleML数据集致力于解决多相流相变现象中机器学习建模的两类核心挑战。在领域问题层面,沸腾过程涉及气泡生成、合并、分裂等非刚性动态,其界面演化与传热耦合机制极为复杂,传统光学流方法难以准确捕捉此类非均匀运动;同时,温度与速度场的联合预测要求模型能同时处理平滑物理场与尖锐相界面,现有神经网络架构在兼顾多物理场耦合与长期滚推稳定性方面仍存在局限。在构建过程中,数据集需克服高保真模拟的巨大计算成本,并整合狄利克雷与诺伊曼混合边界条件以贴近真实场景,同时确保模拟结果与实验观测趋势的一致性,这要求精细的数值方法设计与严格的验证流程。
常用场景
经典使用场景
在相变传热领域,BubbleML数据集为机器学习模型提供了高保真的多物理场仿真数据,涵盖了核态沸腾、流动沸腾及过冷沸腾等多种沸腾场景。该数据集通过物理驱动的仿真生成了精确的速度、温度与压力场真值,为研究气泡动力学与传热性能的复杂相互作用奠定了数据基础。其经典应用场景在于训练科学机器学习模型,以预测沸腾过程中的温度传播与流体动力学行为,尤其适用于探索临界热通量等关键传热现象。
解决学术问题
BubbleML数据集有效解决了相变现象研究中高保真实验数据稀缺的学术难题。传统实验受限于测量成本与混沌动力学,难以获取微观尺度的全场真值数据。该数据集通过大规模仿真提供了涵盖多种重力条件、流速与过冷度的参数化数据,使研究人员能够系统探究沸腾过程中的多物理场耦合机制。其意义在于为科学机器学习领域建立了首个专注于多相相变问题的基准数据集,推动了数据驱动方法在复杂传热系统建模中的应用,并为理解沸腾危机等关键物理现象提供了新途径。
实际应用
BubbleML数据集的实际应用场景紧密关联于高热通量散热系统的设计与优化。在数据中心液冷技术中,基于沸腾的两相冷却系统需要精确预测气泡行为以提升散热效率。该数据集通过仿真模拟了电子设备冷却中常见的流动沸腾条件,为开发实时监测与控制算法提供了训练数据。此外,在核废料处理与海水淡化等工业过程中,沸腾动力学的准确建模对系统安全与能效至关重要。BubbleML通过提供涵盖实际工况参数的数据,助力机器学习模型在这些关键工程领域的落地应用。
数据集最近研究
最新研究方向
在相变现象与多物理场模拟领域,BubbleML数据集正成为科学机器学习研究的关键催化剂。该数据集通过高保真物理驱动模拟,提供了涵盖核态池沸腾、流动沸腾及过冷沸腾等多种沸腾场景的精确地面真实数据,填补了传统实验数据在可及性与多样性上的空白。前沿研究聚焦于两大基准任务:一是利用光学流分析捕捉气泡动力学的非刚性运动,推动物理信息光学流模型的发展;二是通过神经算子网络学习温度动态与热通量预测,探索多物理场耦合下的联合建模。这些方向不仅关联高热流密度冷却、核废料处理等热点工程应用,更促进了科学机器学习在非光滑界面处理、长时程推演稳定性等核心挑战上的突破,为相变传热系统的优化设计与实时控制奠定了数据驱动的基础。
相关研究论文
  • 1
    BubbleML: A Multi-Physics Dataset and Benchmarks for Machine Learning加州大学欧文分校 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作