five

SIGMA

收藏
arXiv2026-03-25 更新2026-03-26 收录
下载链接:
https://airvlab.github.io/sigma
下载链接
链接失效反馈
官方服务:
资源简介:
SIGMA是由FPT软件AI中心、伦敦帝国学院等机构联合开发的首个基于物理原理的气体烟囱标注数据集,旨在解决地震图像中流体迁移特征识别的难题。该数据集包含通过逆向时间迁移生成的合成地震图像,涵盖原始速度模型、清洁地震图像、气体饱和度图及气体烟囱效应修饰后的多模态数据,数据生成过程融合了随机断裂网络建模和声学波传播物理模拟。作为地震解释领域的基准数据集,SIGMA为油气勘探中的储层监测和钻井风险评估提供了重要研究基础,尤其适用于基于深度学习的图像增强和语义分割任务。

SIGMA is the first physics-informed labeled dataset for gas chimneys, jointly developed by FPT Software AI Center, Imperial College London and other research institutions, aiming to address the challenge of identifying fluid migration features in seismic images. This dataset contains synthetic seismic images generated via reverse-time migration, covering original velocity models, clean seismic images, gas saturation maps, and multi-modal data modified with gas chimney effects. The data generation process integrates stochastic fracture network modeling and physical simulations of acoustic wave propagation. As a benchmark dataset in the field of seismic interpretation, SIGMA provides an important research foundation for reservoir monitoring and drilling risk assessment in oil and gas exploration, and is particularly suitable for deep learning-based image enhancement and semantic segmentation tasks.
提供机构:
FPT软件AI中心; 伦敦帝国学院; 阿肯色大学; 南布列塔尼大学; 利物浦大学
创建时间:
2026-03-25
原始信息汇总

SIGMA: 用于地震图像中气烟囱理解的物理基准数据集

数据集概述

SIGMA是一个新的、基于物理的数据集,用于地震图像中的气烟囱理解。该数据集提供像素级的气烟囱掩码用于检测任务,以及配对的退化/地面真实图像用于增强任务。

数据集生成方法

SIGMA通过一个基于物理的框架生成:从真实世界的速度模型出发,模拟气烟囱效应,构建受气体影响的速度场,并使用逆时偏移合成地震图像。该流程为基准任务提供了配对的干净/退化地震图像以及气烟囱监督信息。

数据集统计

  • 地震图像对数量: 400
  • 速度模型数量: 20
  • 总覆盖面积: 1,600+ km²

引用信息

  • 标题: SIGMA: A Physics-Based Benchmark for Gas Chimney Understanding in Seismic Images
  • 作者: Bao Truong, Quang Nguyen, Baoru Huang, Jinpei Han, Van Nguyen, Ngan Le, Minh-Tan Pham, Doan Huy Hien, Anh Nguyen
  • 年份: 2026
  • 论文地址: https://arxiv.org/abs/2603.23439
搜集汇总
数据集介绍
main_image_url
构建方式
在地球物理勘探领域,高精度标注数据的稀缺性长期制约着基于深度学习的天然气烟囱识别与增强研究。SIGMA数据集通过物理驱动的合成管道构建,其核心流程始于从真实地质场景中采集的20个原始速度模型。每个模型通过随机生成的裂缝网络模拟气体扩散过程,基于声学模型计算气体饱和度分布,进而推导出受气体影响的速度模型。随后,利用逆时偏移技术将原始与受扰速度模型分别转换为对应的清洁与退化地震图像,最终形成包含像素级烟囱掩码及图像对的标准化样本。这一流程严格遵循波动方程与岩石物理原理,确保了合成数据在地震响应上的物理一致性。
使用方法
SIGMA数据集为地震图像理解研究提供了系统性的评估基准。在应用层面,研究者可将数据集划分为训练集与测试集,分别包含300与100个图像对,并基于此开展天然气烟囱检测与图像增强两大核心任务。检测任务通常被构建为语义分割问题,可利用提供的像素级掩码训练卷积神经网络或视觉Transformer模型,以精确勾勒烟囱区域的边界。增强任务则侧重于从退化图像中恢复清洁的地震纹理,可通过生成对抗网络或扩散模型等架构实现图像到图像的映射。数据集的成对设计使得模型能够进行端到端训练,并通过结构相似性指数、峰值信噪比等指标进行定量评估,从而推动算法在复杂地质条件下的泛化能力。
背景与挑战
背景概述
SIGMA数据集由FPT软件人工智能中心、帝国理工学院、阿肯色大学、南布列塔尼大学和利物浦大学的研究团队于2026年联合创建,旨在解决地震图像中气体烟囱现象的理解难题。气体烟囱是地下流体迁移引发的垂直异常区域,其准确识别对评估油气潜力和规避钻井风险至关重要。该数据集通过基于物理的合成方法,生成了包含像素级气体烟囱掩码以及退化与真实图像对的样本,弥补了真实标注数据稀缺的空白,为基于深度学习的地震图像增强与检测研究提供了首个具有物理真实性的基准平台,显著推动了自动地震解释与地下异常检测领域的发展。
当前挑战
SIGMA数据集致力于解决地震图像中气体烟囱检测与增强的核心挑战。在领域问题层面,气体烟囱因地震波衰减和散射效应,常呈现微弱、空间非相干且边界模糊的特征,使得传统物理方法计算成本高昂且对模型误差敏感,而深度学习方法又受限于标注数据的匮乏。在构建过程中,研究团队面临合成数据真实性与计算效率的双重考验:一方面需通过复杂的物理建模模拟广泛地质场景与数据采集条件,确保合成图像的结构与纹理特征逼近真实地震信号;另一方面,每个样本的生成需依赖高性能GPU进行长达30-45分钟的仿真与优化,凸显了该领域数据制备的极高计算开销。
常用场景
经典使用场景
在地球物理勘探领域,SIGMA数据集为气体烟囱的自动检测与增强任务提供了标准化的基准平台。该数据集通过物理模拟生成了包含气体烟囱效应的合成地震图像及其对应的像素级标注,使得研究人员能够在此统一框架下训练和评估深度学习模型。经典应用场景包括利用卷积神经网络或Transformer架构进行气体烟囱区域的精确分割,以及采用生成对抗网络或扩散模型对受衰减影响的区域进行图像恢复,从而推动地震解释技术从传统属性分析向数据驱动方法的演进。
解决学术问题
SIGMA数据集有效解决了地震解释中气体烟囱研究长期面临的标注数据匮乏问题。传统方法依赖昂贵且主观的人工解释,而该数据集通过物理基础的合成管道提供了大规模、多样化的标注样本,使得监督学习模型得以训练。这促进了气体烟囱检测与增强任务的算法创新,例如在分割任务中评估FaultSeg、DualUnet等模型的性能,在增强任务中比较ConditionGAN、SeisDDPM等方法的优劣。数据集的存在为量化模型泛化能力、探索物理约束与数据驱动融合的新范式奠定了实证基础。
实际应用
在实际油气勘探与碳封存监测中,SIGMA数据集支撑的技术可直接应用于地下流体运移路径的识别与风险评估。气体烟囱的准确检测有助于定位烃类储层或潜在钻井危险区,而其图像增强能力则能恢复被衰减掩盖的地质构造连续性,提升储层描述的可靠性。例如,在北海等区域的勘探项目中,基于该数据集训练的模型可辅助解释人员快速筛查地震数据中的异常带,优化井位部署决策,并在二氧化碳地质封存中评估盖层完整性,防范流体泄漏风险。
数据集最近研究
最新研究方向
在地球物理勘探领域,SIGMA数据集的推出标志着基于物理的合成数据生成技术在解决实际勘探难题方面迈出了关键一步。该数据集通过精确模拟气体烟囱效应下的地震波传播与衰减过程,为深度学习模型提供了具有像素级标注的训练样本,有效弥补了传统方法因缺乏真实标注数据而面临的瓶颈。当前研究前沿聚焦于利用该数据集开发端到端的图像增强与分割模型,旨在提升气体烟囱区域的检测精度与地震特征恢复能力。相关热点探索包括结合生成对抗网络与扩散模型进行地震图像超分辨率重建,以及构建面向地震数据的基础模型以增强跨任务的泛化性能。这些进展不仅推动了自动化地震解释技术的发展,也为油气资源勘探与碳封存安全评估提供了更为可靠的技术支撑,具有显著的工程应用价值与学术影响力。
相关研究论文
  • 1
    SIGMA: A Physics-Based Benchmark for Gas Chimney Understanding in Seismic ImagesFPT软件AI中心; 伦敦帝国学院; 阿肯色大学; 南布列塔尼大学; 利物浦大学 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作