five

AI4EPS/quakeflow_nc

收藏
Hugging Face2025-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AI4EPS/quakeflow_nc
下载链接
链接失效反馈
官方服务:
资源简介:
Quakeflow_NC数据集包含了1970年至2020年期间北加州地震数据中心(NCEDC)的地震数据,数据以HDF5文件格式组织。数据集包含地震事件的详细信息,如事件时间、深度、经纬度、震级等,以及地震波形的数据。数据集分为训练集和测试集,训练集包含1970年至2019年的数据,测试集包含2020年的数据。数据集的使用需要安装特定的Python库,并提供了多种配置选项,如按站点或事件加载数据。

The Quakeflow_NC dataset comprises seismic data sourced from the Northern California Earthquake Data Center (NCEDC) for the period between 1970 and 2020, with all data organized in HDF5 file format. It contains detailed information about seismic events, including event time, depth, latitude, longitude, magnitude, as well as seismic waveform data. The dataset is split into a training set and a test set: the training set covers data from 1970 to 2019, while the test set contains data from 2020. Usage of the dataset requires installation of specific Python libraries, and multiple configuration options are provided, such as loading data by station or by event.
提供机构:
AI4EPS
原始信息汇总

数据集概述

数据集名称

  • Quakeflow_NC

数据来源

数据格式

  • 数据组织为多个HDF5文件。

引用信息

  • 引用时需提及NCEDC和PhaseNet,参考文献为Zhu, W., & Beroza, G. C. (2018). PhaseNet: A Deep-Neural-Network-Based Seismic Arrival Time Picking Method. arXiv preprint arXiv:1803.03211.

数据结构示例

  • 数据集包含多个事件记录,每个事件记录包括事件时间、位置、震级等详细信息,以及相关的地震波形数据。

数据使用

数据集配置

  • 数据集提供6种配置:"station", "event", "station_train", "event_train", "station_test", "event_test"。
  • "station"和"event"分别提供以站点和事件为基础的样本。
  • "_train"和"_test"配置分别包含1970至2019年和2020年的数据。

样本结构

  • station样本:包含数据波形、开始时间、结束时间、相位到达时间等信息。
  • event样本:包含多站点波形数据、相位到达时间、事件时间等详细信息。

加载示例

  • 使用load_dataset函数加载数据集,可通过name参数指定配置,如station_testevent_train

注意事项

  • 数据集较大,首次加载可能需要较长时间。
  • 由于HDF5特性,不支持流式(Iterable Dataset)加载,建议直接加载数据集。
搜集汇总
数据集介绍
main_image_url
构建方式
在地震学领域,高质量的数据集对于推进地震监测与预警技术至关重要。Quakeflow_NC数据集基于北加州地震数据中心(NCEDC)1970年至2020年的历史地震数据构建,通过精心整理与标准化处理,将原始波形数据与事件元数据整合为结构化的HDF5文件。该构建过程遵循AI4EPS组织提出的地震事件格式规范,确保了数据的一致性与可扩展性。每个HDF5文件以层次化组结构组织,包含事件标识、时空坐标、震级信息以及多站点的三分量波形数据,同时标注了震相到达时间、极性与信噪比等关键属性,为机器学习模型提供了丰富的训练与验证素材。
使用方法
为高效利用Quakeflow_NC数据集,研究者需依托datasets、h5py及PyTorch等工具库。数据集提供六种配置模式,包括station与event视角及其对应的训练与测试划分,用户可通过load_dataset函数指定name参数灵活加载。以station_test为例,每个样本以字典形式返回,核心字段涵盖波形数据数组、事件起止时间、震相到达时间与类型、台站及震源空间坐标等。由于数据集规模庞大,首次加载需耐心等待;建议直接加载完整集合并后续转换为可迭代对象,结合DataLoader进行批处理以适配深度学习流程。示例代码清晰展示了数据遍历与格式转换步骤,助力用户快速集成至地震分析或机器学习管道中。
背景与挑战
背景概述
地震学领域长期致力于通过波形数据解析地球内部结构与地震活动规律,Quakeflow_NC数据集作为该领域的重要资源,由AI4EPS团队基于北加州地震数据中心(NCEDC)1970年至2020年的观测数据构建而成。该数据集以HDF5格式组织,整合了地震事件的时间、空间、震级及多台站波形信息,其核心研究问题聚焦于提升地震波相位自动拾取与事件定位的精度与效率。通过引入深度学习方法如PhaseNet,该数据集推动了地震信号处理从传统经验模型向数据驱动智能分析的范式转变,为地震监测与预警系统的优化提供了关键数据支撑。
当前挑战
在地震波形分析领域,自动识别P波与S波到达时间面临信号噪声干扰、复杂地质结构导致波形畸变等固有难题,Quakeflow_NC数据集旨在通过大规模标注数据缓解此类挑战。数据构建过程中,整合跨五十年的多源观测记录需克服时间跨度大、台站分布不均、数据格式异构等问题,同时确保事件标注的时空一致性。此外,海量波形数据的高效存储与快速访问要求设计优化的HDF5层级结构,以平衡数据完整性与计算负载,为机器学习模型训练提供稳定基础。
常用场景
经典使用场景
在地震学领域,Quakeflow_NC数据集为地震波形分析提供了结构化数据支持。该数据集以台站和事件为基础组织波形数据,经典使用场景包括训练和评估地震波相位拾取模型。研究人员利用其包含的P波和S波到达时间、相位极性及信噪比等信息,开发深度学习算法以自动识别地震事件,提升地震监测的自动化水平。
解决学术问题
该数据集有效解决了地震学中波形数据标注不足和标准化缺失的学术难题。通过提供1970年至2020年北加州地震数据中心的标注波形,它支持相位拾取、事件定位和震级估算等核心研究。其结构化格式促进了机器学习模型在地震信号处理中的应用,推动了地震预警系统和震源机制解析的算法进步。
实际应用
在实际应用中,Quakeflow_NC数据集被集成到地震监测网络中,用于实时地震检测和预警。例如,基于该数据集训练的模型可部署于地震台站,自动分析波形数据以快速识别地震事件,辅助应急响应部门进行灾害评估。此外,它还为地震风险评估和地下结构成像提供数据基础,提升公共安全防护能力。
数据集最近研究
最新研究方向
在地球物理与人工智能交叉领域,Quakeflow_NC数据集正推动地震监测技术的前沿探索。该数据集整合了北加州地震数据中心长达五十年的波形与事件数据,为深度学习模型提供了丰富的训练资源。当前研究聚焦于利用此类结构化数据开发端到端的地震检测与定位算法,例如基于Transformer架构的序列模型,能够直接从原始波形中识别P波与S波到时,并精确估算震源参数。随着实时地震预警系统需求的增长,该数据集支持的研究助力于提升小震检测能力与早期预警速度,对防震减灾具有重要科学意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作