five

Pore-Scale CO2-Water Interaction Benchmark Dataset

收藏
arXiv2025-03-22 更新2025-03-26 收录
下载链接:
https://doi.org/10.5061/dryad.jm63xsjn5
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由赫瑞瓦特大学地球能源工程学院创建,是一个包含624个二维样本的数据集,每个样本大小为512×512像素,分辨率高达35微米,覆盖了100个时间步长的CO2和水相互作用的模拟结果。数据集体现了不同粒度大小和随机间隔变化的异质性,为机器学习模型提供了一个强大的测试平台。数据集以HDF5格式提供,包含了流速度分量、压力场、饱和度场和物理域表示的高分辨率数据,适用于科学和工程应用。

This dataset was created by the School of Geoscience and Energy Engineering at Heriot-Watt University. It includes 624 2D samples, each with a size of 512×512 pixels and a maximum resolution of 35 micrometers, covering simulation results of CO₂-water interactions across 100 time steps. The dataset exhibits heterogeneity with varying grain sizes and randomly spaced variations, serving as a robust testbed for machine learning models. Provided in HDF5 format, it contains high-resolution data of flow velocity components, pressure fields, saturation fields and physical domain representations, applicable for scientific and engineering applications.
提供机构:
赫瑞瓦特大学地球能源工程学院(Institute of GeoEnergy Engineering, Heriot-Watt University)
创建时间:
2025-03-22
搜集汇总
数据集介绍
main_image_url
构建方式
Pore-Scale CO2-Water Interaction Benchmark Dataset的构建基于高保真数值模拟技术,采用GeoChemFoam开源数值模拟器进行多相流模拟。原始1024×1024的模拟域被裁剪为四个子样本,并通过垂直翻转操作将数据集规模扩大八倍。每个样本尺寸为512×512像素,物理分辨率为35µm,涵盖5种不同异质性水平的几何结构。模拟过程中,CO2以恒定速率注入水饱和的多孔介质,记录100个时间步长的动态变化,包括压力场、毛细管压力场和流速场等关键参数。数据以HDF5格式存储,确保了高精度的科学数据管理。
特点
该数据集的核心价值在于其前所未有的时空分辨率与地质异质性的系统表征。624个二维样本不仅提供了512×512的高空间分辨率,还完整记录了CO2驱替过程的100个瞬态快照,突破了传统数据集仅关注最终状态的局限。通过设计五种梯度化的颗粒尺寸分布,数据集实现了样本间异质性与样本内局部异质性的有机结合,精确模拟了真实储层中从均质砂岩到复杂非均质储层的连续谱系。每个样本配套的孔隙度、渗透率等岩石物理参数,以及与OpenFOAM兼容的原始输入文件,共同构成了多尺度研究的理想基准平台。
使用方法
研究人员可通过Python的h5py库直接读取HDF5格式的模拟数据,其中包含的水饱和度场、压力场等关键变量均采用标准化命名规范。数据使用遵循CO2饱和度计算关系式αCO2=(1-αwater)×img,img为二值化孔隙空间标识。配套提供的CSV文件记载了孔隙度、渗透率等岩石物理参数的时间演化,便于与机器学习模型的预测结果进行定量对比。为复现模拟过程,用户可调用GitHub开源的GeoChemFoam-5.1求解器,其1×10^-8的收敛容差设置保障了数值解的可靠性。该数据集特别适用于开发时空预测模型,以及验证多相流模拟算法的精度。
背景与挑战
背景概述
Pore-Scale CO2-Water Interaction Benchmark Dataset由英国赫瑞瓦特大学(Heriot-Watt University)地质能源工程研究所(IGE)的Alhasan Abdellatif和Hannah P. Menke等研究人员于2025年创建。该数据集聚焦于多孔介质中CO2-水相互作用的孔隙尺度表征问题,旨在为碳捕集与封存(CCS)等地质工程应用提供高保真基准数据。通过高分辨率数值模拟生成了624个512×512像素的二维样本,空间分辨率达35µm,涵盖100个时间步长的CO2注入过程,并包含5种不同异质性水平的岩相结构。该数据集填补了孔隙尺度动态过程数据缺乏的空白,为机器学习模型在碳封存领域的应用提供了重要支撑。
当前挑战
该数据集致力于解决孔隙尺度多相流模拟中的关键挑战:现有数据难以捕捉CO2在非均质多孔介质中的动态运移规律,传统实验方法受限于时空分辨率,而数值模拟则面临高昂计算成本。数据构建过程中需克服三重困难:首先,精确模拟微米尺度下CO2-水-岩石三相的复杂界面相互作用,涉及表面张力、接触角等多物理场耦合;其次,需平衡计算精度与效率,在512×512大网格上实现10^-8的高收敛精度;最后,通过设计5级岩相异质性和时间序列采样,确保数据既能反映地质复杂性又可支持动态预测模型的训练。
常用场景
经典使用场景
在碳封存与地质能源工程领域,Pore-Scale CO2-Water Interaction Benchmark Dataset通过高保真数值模拟生成的624组二维孔隙尺度动态交互数据,为研究超临界CO2在多孔介质中的运移机制提供了标准测试平台。其512×512像素分辨率配合35µm的物理精度,完整记录了恒定注入速率下100个时间步的相态演变过程,尤其适用于分析非均质储层中毛细管力与粘滞力的耦合效应。
解决学术问题
该数据集有效解决了传统实验方法难以捕捉动态过程、数值模拟计算成本高昂的学术痛点。通过提供包含五种异质性等级的时空连续数据,支持机器学习模型突破256×256网格尺寸限制,实现了对CO2饱和度场演化、压力梯度分布等关键参数的精准预测。其时间序列特性填补了现有数据集仅关注最终状态的空白,为理解CO2-盐水-矿物三相瞬态反应机制提供了数据基础。
衍生相关工作
基于该基准数据,学界涌现出多项创新成果。Zhong等开发的cGAN模型实现了非均质储层CO2羽流预测,Wen团队构建的U-FNO架构将多相流模拟速度提升三个数量级。GeoChemFoam研究组进一步扩展了化学反应的耦合模拟,而Zhao等则通过数据同化技术建立了孔隙网络模型与深度学习结合的混合方法。这些工作共同推动了能源地质领域的数字孪生技术发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作