five

GlobalTomo|地震学数据集|机器学习数据集

收藏
github2024-06-03 更新2024-06-06 收录
地震学
机器学习
下载链接:
https://github.com/lishiqianhugh/GlobalTomo
下载链接
链接失效反馈
资源简介:
首个全球数据集,用于物理-ML地震波场建模和全波形反演。

The first global dataset designed for physics-ML seismic wavefield modeling and full waveform inversion.
创建时间:
2024-06-03
原始信息汇总

GlobalTomo 数据集概述

数据集结构

GlobalTomo/ │ ├── conf/ │ ├── config.yaml # 配置文件 │ ├── images/
│ └── overview.jpg │ ├── scripts/
│ ├── eq.py # PDE约束定义 │ ├── load_data.py # 从.h5文件加载数据 │ ├── meta_info.py # 数据元信息 │ ├── misc.py # 定制训练工具 │ ├── model.py # 定制ML模型 │ └── plot.py # 可视化工具 │ ├── .gitignore # Git忽略内容 ├── infer.py # 评估函数 ├── inverse.py # 反演函数 ├── LICENSE # 许可证 ├── README.md # 使用说明 ├── requirements.txt # 依赖项 └── train.py # 训练脚本

开始使用

conda create -n globaltomo python==3.8 conda activate globaltomo pip install -r requirements.txt

训练正向模型

conf目录中定义训练配置文件。提供示例YAML文件以方便开始。通常,应在这些文件中指定数据层级、模型类型和期望输出。确保配置中的custom.name与文件名匹配。

启动训练的命令:

python train.py --config-name=acoustic_wfslice_MLP

训练完成后,检查点将自动存储在outputs目录中。

评估正向模型

infer.py中指定wave_typeoutput_typemodel_name

启动评估的命令:

python infer.py

如果模型路径存在,代码将自动加载配置和模型参数进行评估。

反演

1. 基于优化的反演

inverse.py中指定模型路径,执行以下命令开始从随机起点优化结构:

python inverse.py

2. 直接反向映射

训练神经网络直接将观测地震图映射到速度结构。创建配置文件,设置custom.velocitytrue,并定义其他参数。使用类似训练正向模型的命令:

python train.py --config-name=acoustic_velocity_MLP

数据下载

点击此链接并填写请求表单以访问数据。

AI搜集汇总
数据集介绍
main_image_url
构建方式
GlobalTomo数据集的构建基于物理-机器学习的地震波场建模和全波形反演技术。该数据集通过整合全球范围内的地震数据,采用先进的数值模拟方法生成高精度的地震波场模型。具体构建过程中,首先定义偏微分方程(PDE)约束条件,然后通过自定义的机器学习模型进行训练,最终生成包含丰富元信息的数据集。这一过程确保了数据集在物理精度和计算效率上的双重优势。
特点
GlobalTomo数据集的显著特点在于其全球覆盖性和高精度模拟。该数据集不仅涵盖了广泛的地理区域,还通过精细的数值模拟技术捕捉了地震波场的复杂动态。此外,数据集的结构设计合理,便于用户快速加载和处理数据。其自定义的训练工具和可视化功能进一步增强了数据集的实用性和可操作性。
使用方法
使用GlobalTomo数据集时,用户首先需创建并激活一个特定的conda环境,并安装所需的依赖项。随后,用户可以通过定义配置文件来启动训练过程,配置文件中需指定数据层级、模型类型和期望输出。训练完成后,模型检查点将自动存储。评估模型时,用户需在infer.py中指定波类型、输出类型和模型名称,然后运行评估命令。此外,数据集还支持基于优化的反演和直接反演映射两种反演策略,用户可根据需求选择合适的反演方法。
背景与挑战
背景概述
GlobalTomo数据集是首个用于物理-机器学习地震波场建模和全波形反演的全球数据集。该数据集由主要研究人员或机构在近年创建,旨在解决地震波场建模和反演中的核心问题。通过整合全球范围内的地震数据,GlobalTomo为研究人员提供了一个全面的数据平台,极大地推动了地震学和机器学习交叉领域的研究进展。其影响力不仅体现在数据集的规模和多样性上,还体现在其对未来地震预测和地质结构分析的潜在贡献。
当前挑战
GlobalTomo数据集在构建过程中面临多项挑战。首先,整合全球地震数据需要克服数据来源多样性和数据质量不均的问题。其次,物理-机器学习模型的训练和验证需要精确的物理约束和大量的计算资源。此外,全波形反演技术在实际应用中仍存在计算复杂度和精度之间的平衡问题。这些挑战不仅影响了数据集的构建效率,也对后续研究提出了更高的技术要求。
常用场景
经典使用场景
在地球物理学领域,GlobalTomo数据集被广泛应用于物理-机器学习地震波场建模和全波形反演。该数据集通过提供全球范围内的地震波数据,使得研究人员能够训练和评估复杂的地震波传播模型。典型的应用场景包括使用机器学习算法预测地震波的传播路径,以及通过全波形反演技术推断地下结构的物理属性。这些模型和技术的训练与评估,均依赖于GlobalTomo数据集所提供的丰富和多样化的地震波数据。
实际应用
在实际应用中,GlobalTomo数据集被用于多个地球物理学相关的项目和工程。例如,地震预警系统可以通过分析该数据集中的地震波数据,提前预测地震的发生和传播路径,从而减少地震灾害的影响。此外,石油和天然气勘探行业也利用GlobalTomo数据集进行地下结构的详细分析,以优化勘探策略和提高资源开采效率。这些应用不仅提升了地球物理学的实际应用价值,也为社会经济的发展提供了重要支持。
衍生相关工作
基于GlobalTomo数据集,许多相关研究工作得以展开并取得了显著成果。例如,有研究团队开发了新的机器学习模型,用于更精确地预测地震波的传播路径。同时,全波形反演技术的改进版本也在不断涌现,这些技术能够更有效地推断地下结构的物理属性。此外,GlobalTomo数据集还激发了跨学科的研究,如结合地理信息系统和大数据分析技术,进一步提升了地球物理数据的处理和解释能力。这些衍生工作不仅丰富了地球物理学的研究内容,也推动了相关技术的创新和发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

HIT-UAV

HIT-UAV数据集包含2898张红外热成像图像,这些图像从43,470帧无人机拍摄的画面中提取。数据集涵盖了多种场景,如学校、停车场、道路和游乐场,在不同的光照条件下,包括白天和夜晚。

github 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录