five

OpenSWI

收藏
Hugging Face2025-07-30 更新2025-07-31 收录
下载链接:
https://huggingface.co/datasets/LiuFeng2317/OpenSWI
下载链接
链接失效反馈
官方服务:
资源简介:
OpenSWI是一个为表面波频散曲线反演设计的综合1D数据集,专门用于浅层地下勘探(约3公里)和深层地质研究(约300公里)。该数据集包含来自各种地质模型的合成数据以及实际观测数据,为评估和提高深度学习模型的泛化能力提供了宝贵的资源。数据集包括: * OpenSWI-Shallow:来自2D速度模型(OpenFWI数据集)的1D速度剖面,配对相应的表面波频散曲线。 * OpenSWI-Deep:来自全球和区域高分辨率3D地质模型生成的1D速度剖面,专门用于深层地质研究。 * OpenSWI-Real:来自美国长滩和中国地震学参考模型项目的观测数据,包含1D速度剖面和相应的表面波频散曲线。
创建时间:
2025-07-22
原始信息汇总

OpenSWI 数据集概述

数据集基本信息

  • 语言: 英语 (en)
  • 标签: inversion, seismic, imaging, subsurface
  • 数据规模: 10B < n < 100B
  • 数据集类型: 合成数据与真实观测数据结合
  • 主要用途: 面波频散曲线反演任务的深度学习模型训练与评估

数据集组成

1. OpenSWI-Shallow

  • 目标: 浅层地下勘探 (~3 km)
  • 数据来源: 2D速度模型 (OpenFWI数据集)
  • 包含内容:
    • 1D速度剖面
    • 对应的面波频散曲线
  • 子数据集:
    • OpenFWI-FlatVelA: 30,000 x 4 x 70 (原始), 1,490,415 x 4 x 70 (增强)
    • OpenFWI-Flat-FaultA: 292,941 x 4 x 70 (原始), 2,925,151 x 4 x 70 (增强)
    • OpenFWI-CurveVel: 295,773 x 4 x 70 (原始), 2,952,975 x 4 x 70 (增强)
    • OpenFWI-Fold-Fault: 537,774 x 4 x 70 (原始), 5,369,692 x 4 x 70 (增强)
    • OpenFWI-StyleA: 2,344,958 x 4 x 70 (原始), 9,345,103 x 4 x 70 (增强)
  • 地质多样性: 平坦层、断层、褶皱及其组合
  • 周期范围: 0.2-10秒
  • 深度范围: 0-2.8 km (间隔0.04 km)

2. OpenSWI-Deep

  • 目标: 深层地质研究 (~300 km)
  • 数据来源: 全球和区域高分辨率3D地质模型
  • 包含内容:
    • 1D速度剖面
    • 对应的面波频散曲线
  • 子数据集:
    • LITHO1.0, USTClitho1.0, Central-and-Western US等14个模型
    • 总计约1.26百万1D速度剖面
  • 周期范围: 1-100秒
  • 深度范围: 0-300 km (间隔1.0 km)

3. OpenSWI-Real

  • 目标: 真实观测数据
  • 包含内容:
    • 1D速度剖面
    • 对应的面波频散曲线
  • 子数据集:
    • LongBeach, USA: 5,297个站点 (周期0.263-1.666秒)
    • 中国地震参考模型(CSRM): 12,901个网格点 (周期8-70秒)

数据集特点

  • 大规模: 总计超过23百万1D速度剖面
  • 多样性: 涵盖多种地质结构和全球不同区域
  • 多尺度: 同时支持浅层(~3 km)和深层(~300 km)研究
  • 真实数据: 包含来自美国和中国的实际观测数据

许可信息

  • 许可证: CC BY 4.0 License

引用格式

bibtex @software{liufeng_2025_openswi, title={OpenSWI: A Massive-Scale Benchmark Dataset for Surface Wave Dispersion Curve Inversion}, author={Feng Liu, Sijie Zhao, Xinyu Gu, Fenghua Ling, Yaxing Li, Rui Su, Peiqin Zhuang, Jianping Huang, Lei Bai}, year={2025}, }

联系方式

  • 主要开发者: Feng Liu
  • 所属机构: 上海人工智能实验室, 上海交通大学
  • 邮箱:
    • liufeng2317@sjtu.edu.cn
    • liufeng1@pjlab.org.cn
搜集汇总
数据集介绍
main_image_url
构建方式
在地球物理勘探领域,OpenSWI数据集的构建采用了多源地质模型融合策略。该数据集整合了来自OpenFWI数据集的二维速度模型以及全球14个高分辨率三维地质模型,通过正演模拟生成了一维速度剖面与对应的面波频散曲线。针对浅层勘探(0-2.8公里)和深层地质研究(0-300公里)需求,分别构建了OpenSWI-Shallow和OpenSWI-Deep子集,并辅以美国长滩和中国地震参考模型的实测数据形成OpenSWI-Real子集。所有数据均经过严格的质量控制和标准化处理,确保地质特征与地球物理响应的精确对应。
特点
OpenSWI数据集的核心特征体现在其多尺度地质表征能力。数据集包含超过2300万条一维速度剖面与对应频散曲线,覆盖0.2-100秒的宽周期范围。浅层子集包含平坦层、断层、褶皱等典型地质构造,深层子集涵盖全球主要构造单元的速度结构。数据采样点采用均匀、随机和对数分布相结合的方式,有效提升了模型训练的泛化性能。实测数据子集更提供了真实观测与理论模型的对比验证基础,为地震反演算法提供了前所未有的丰富样本。
使用方法
该数据集专为面波频散曲线反演任务设计,用户可通过标准数据加载接口获取结构化数据。每个样本包含四通道一维速度剖面(Vp、Vs、密度、Q值)和对应的瑞利波频散曲线。研究人员可分别使用浅层、深层和实测子集进行模型训练、验证和测试,支持监督学习和半监督学习范式。数据集提供完整的元数据标注,包括地质模型来源、采样间隔和周期范围,便于针对特定勘探场景定制训练策略。预划分的训练/测试集支持即插即用的基准测试。
背景与挑战
背景概述
地震学领域中的面波频散曲线反演是揭示地球内部结构的关键技术,OpenSWI数据集由上海人工智能实验室与上海交通大学联合团队于2025年发布,旨在为浅层(约3公里)和深层(约300公里)地质研究提供大规模基准数据。该数据集整合了合成数据与真实观测数据,涵盖全球多个高分辨率地质模型,显著提升了深度学习模型在地震反演任务中的泛化能力与准确性,推动了计算地震学与人工智能的交叉融合。
当前挑战
面波频散曲线反演长期面临非线性、多解性及计算复杂度高的挑战,OpenSWI通过提供多尺度地质模型与对应频散曲线,致力于解决模型泛化性与真实数据适配性问题。构建过程中需协调全球异构地质数据源,统一数据格式与采样标准,并克服合成数据与真实观测数据间的域差异,确保数据质量与一致性。
常用场景
经典使用场景
在地球物理勘探领域,OpenSWI数据集为面波频散曲线反演任务提供了大规模基准数据支持。该数据集通过整合浅层(OpenSWI-Shallow)与深层(OpenSWI-Deep)地质模型,覆盖了从地表至300公里深度的速度结构信息,广泛应用于训练和评估深度学习模型在瑞利波频散曲线反演中的性能。其多尺度、多来源的数据特性使其成为研究地下结构横向变化与垂向分层的重要工具,尤其适用于地震层析成像和全波形反演等前沿方法。
衍生相关工作
该数据集衍生出多项经典研究工作,例如基于OpenFWI数据集的全波形反演算法优化、结合LITHO1.0模型的全球岩石圈结构重构,以及利用CSRM数据构建中国地震参考模型。这些研究不仅推动了深度学习在地球物理中的跨学科应用,还催生了如联合反演框架、多模态数据融合技术等创新方法,为领域发展提供了持续的理论与实践动力。
数据集最近研究
最新研究方向
在地球物理勘探领域,OpenSWI数据集正推动面波频散曲线反演研究向深度学习范式转型。该数据集整合了全球14个高分辨率三维地质模型与真实观测数据,为浅层至深部地质结构研究提供了前所未有的多尺度训练资源。当前研究热点集中于利用生成式对抗网络提升速度剖面重建精度,并结合迁移学习解决跨区域泛化难题。随着计算地震学与人工智能的深度融合,该数据集显著加速了全波形反演算法的迭代优化,为资源勘探和地质灾害预警提供了关键数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作