LUNDIsim
收藏arXiv2025-08-19 更新2025-11-26 收录
下载链接:
https://zenodo.org/records/14641959
下载链接
链接失效反馈官方服务:
资源简介:
LUNDIsim 数据集是一个用于流模拟和科学数据压缩基准的模型网格。它由 IFP Energies nouvelles 和 Université Côte d'Azur 等机构开发,旨在解决地球科学领域中数据量激增带来的计算、解释和可持续性问题。数据集包括四个不同的地下环境模型,主要用于多孔介质中的流模拟。每个模型都提供了几种一致性的分辨率,并包含了一系列储层特征,用于在储层工程背景下重现典型的两相流模拟。LUNDIsim 数据集主要用于基准测试和评估数据规模减少(放大)或真正的复合网格压缩算法,也适用于地质和储层工程中的其他高级网格处理工作流程。
The LUNDIsim dataset is a model grid for flow simulation and scientific data compression benchmarks. It was developed by institutions including IFP Energies nouvelles and Université Côte d'Azur, aiming to address the computational, interpretive, and sustainability challenges arising from the rapid growth of data volume in the field of geosciences. The dataset includes four distinct subsurface environmental models, primarily intended for flow simulations in porous media. Each model offers several consistent resolutions and incorporates a suite of reservoir characteristics designed to replicate typical two-phase flow simulations within the context of reservoir engineering. The LUNDIsim dataset is primarily used for benchmarking and evaluating data size reduction (upscaling) or genuine composite grid compression algorithms, and is also applicable to other advanced grid processing workflows in geology and reservoir engineering.
提供机构:
IFP Energies nouvelles, France; Université Côte d'Azur, CNRS, I3S, France
创建时间:
2025-08-19
搜集汇总
数据集介绍
构建方式
LUNDIsim数据集的构建基于SPE10比较解决方案项目的模型2,采用128×128×32的六面体网格结构,并引入三个垂直断层以增强地质复杂性。网格尺寸设计为2的幂次方,便于多尺度分解和压缩算法的基准测试。数据集包含四种不同的地质环境模拟,每种环境通过随机生成孔隙度和渗透率分布,以反映从均质到各向异性的多样化地质特征。数据生成过程结合了Paradigm™的GOCAD地质建模软件和MATLAB Reservoir Simulation Toolbox (MRST)。
特点
LUNDIsim数据集的核心特点在于其多尺度表示和异构数据类型的集成。数据集不仅提供原始分辨率的网格模型,还通过HexaShrink框架生成多个低分辨率版本,确保断层信息在不同尺度下的一致性。孔隙度和渗透率数据覆盖了广泛的动态范围,从高度均质的近岸环境到高度异质的河流环境,为压缩算法和流动模拟提供了丰富的测试场景。此外,数据集遵循FAIR原则,确保可查找、可访问、可互操作和可重用。
使用方法
LUNDIsim数据集主要用于评估无损和有损压缩算法在地质模型中的应用效果。用户可以通过数据集提供的多分辨率模型,测试不同压缩策略对流动模拟结果的影响。数据集还支持其他地质和储层工程应用,如可视化、机器学习和多尺度分析。使用GRDECL格式存储的模型兼容多种开源工具(如ResInsight、PyGRDECL和XTGeo),便于集成到现有工作流中。用户可通过Zenodo平台获取数据集,并参考附带的全球储层特征和流体生产数据,复现典型的两相流动模拟。
背景与挑战
背景概述
LUNDIsim数据集是由IFP Energies nouvelles和Université Côte d’Azur的研究团队于2021年开发的,旨在解决地质科学和油藏工程中大规模数值模拟数据的存储与处理问题。该数据集的核心研究问题聚焦于三维地质网格模型的压缩与多尺度表示,特别针对孔隙度和渗透率等关键属性数据。LUNDIsim的创建灵感来源于SPE10比较项目,通过提供四种不同的地质环境模型(近岸和河流相),支持流动模拟和科学数据压缩算法的性能评估。该数据集的开放共享遵循FAIR原则,显著提升了地质建模与数据压缩领域的可重复性和研究效率。
当前挑战
LUNDIsim数据集面临的挑战主要包括:1) 领域问题的复杂性,如地质数据的强异质性(结构化与非结构化数据混合)和高动态范围属性(如渗透率跨越多个数量级),导致通用压缩算法效率低下;2) 构建过程中的技术难题,包括多尺度表示下断层几何的一致性保持、混合数据类型(布尔型活动标签与浮点型物性参数)的协同压缩,以及压缩误差对流动模拟结果的可控性评估。此外,数据精度与分辨率对仿真结果的主观解释差异,也增加了质量评估的难度。
常用场景
经典使用场景
LUNDIsim数据集作为地质科学和油藏工程领域的基准数据集,主要用于评估三维地质网格模型在流模拟和科学数据压缩算法中的性能。其经典使用场景包括多相流模拟、网格压缩算法的基准测试以及多尺度地质模型的可视化分析。数据集通过提供不同分辨率的网格模型和孔隙度/渗透率属性,为研究人员提供了丰富的实验材料,以验证算法在不同地质环境下的适用性和效率。
衍生相关工作
LUNDIsim数据集已衍生出多项经典研究工作,包括HexaShrink多分辨率框架的优化、基于POSIT格式的混合精度计算探索以及机器学习驱动的压缩算法开发。这些工作显著推进了地质科学数据的压缩技术,并为跨学科研究(如气候建模与HPC工作流)提供了方法论参考。数据集还启发了后续的开放地质模型共享计划,如SPE11碳封存挑战赛的基准数据设计。
数据集最近研究
最新研究方向
LUNDIsim数据集作为地质科学和油藏工程领域的前沿研究工具,近期研究聚焦于多尺度数据压缩算法在复杂地质网格上的性能评估与优化。随着高精度数值模拟产生的数据量呈指数级增长,如何在保持地质结构特征(如断层、孔隙度/渗透率分布)的前提下实现高效压缩成为关键挑战。研究热点集中在三个方面:一是基于HexaShrink框架的多分辨率表示与混合精度编码技术,探索地质数据在压缩率与模拟保真度之间的平衡点;二是结合新型算术格式(如POSIT)和机器学习方法,开发面向非均匀地质属性的自适应压缩策略;三是在碳中和背景下,拓展数据集在二氧化碳封存、氢能源储存等可持续能源领域的跨学科应用验证。该数据集通过提供标准化的断层地质网格和SPE10启发的多环境参数,为比较不同升尺度算法、评估压缩对两相流模拟的影响建立了基准平台,其FAIR原则下的开放共享特性进一步推动了地球科学数据压缩研究的可重复性与协作创新。
相关研究论文
- 1通过IFP Energies nouvelles, France; Université Côte d'Azur, CNRS, I3S, France · 2025年
以上内容由遇见数据集搜集并总结生成



