five

加州地震事件数据集 (California Earthquake Event Dataset, CEED)

收藏
arXiv2025-02-17 更新2025-02-19 收录
下载链接:
https://huggingface.co/datasets/AI4EPS/CEED
下载链接
链接失效反馈
官方服务:
资源简介:
加州地震事件数据集(CEED)是由加州大学伯克利分校地震学实验室和加州理工学院地震学实验室共同创建的统一数据集,整合了北方加州地震数据中心(NCEDC)和南方加州地震数据中心(SCEDC)的地震记录。该数据集包含自动和手动确定的地震参数,如地震起源时间、源头位置、P/S波到达时间、初动极性和地面运动强度测量等。数据集按照年度事件格式组织,从2000年至2024年,便于与事件目录交叉引用,并支持未来年份的持续更新。这个全面开放的访问数据集旨在支持深度学习模型开发、创建增强型目录产品和地震过程、断层带结构以及地震风险研究等多样化应用。

The California Earthquake Event Dataset (CEED) is a unified dataset co-created by the Seismological Laboratory of the University of California, Berkeley, and the Seismological Laboratory of the California Institute of Technology, integrating seismic records from the Northern California Earthquake Data Center (NCEDC) and the Southern California Earthquake Data Center (SCEDC). This dataset includes both automatically and manually determined seismic parameters, such as earthquake origin time, hypocenter location, P/S wave arrival times, first-motion polarity, and ground motion intensity measurements. Organized in annual event format spanning from 2000 to 2024, the dataset facilitates cross-referencing with event catalogs and supports continuous updates for future years. As a comprehensively open-access dataset, it aims to support a wide range of applications, including deep learning model development, creation of enhanced catalog products, and research on earthquake processes, fault zone structures, and seismic risks.
提供机构:
加州大学伯克利分校地震学实验室,加州理工学院地震学实验室
创建时间:
2025-02-17
搜集汇总
数据集介绍
main_image_url
构建方式
加州地震事件数据集(CEED)的构建是基于加利福尼亚州北部和南部地震数据中心的地震目录和连续波形数据。该数据集整合了自2000年至2024年间的地震事件,并包括了由人类分析师手动标注的参数,如地震发生时间、震源位置、P/S波到时、初动极性和地面运动强度测量等。数据集采用了事件为基础的格式,按年份组织,以便于与事件目录进行交叉参考,并便于未来的持续更新。
特点
CEED数据集的特点在于其全面性和开放性。它包含了来自加利福尼亚州广泛监测网络的地震记录,涵盖了多种类型的地震活动,如构造地震、地热场诱导的地震活动、火山地震以及海底事件。数据集的规模庞大,包含了超过410万个带标签的波形,使其成为2023年为止最大的机器学习数据集之一。此外,数据集采用了事件为基础的层级格式,便于与单站和多站深度学习模型兼容,并支持与USGS综合地震目录的交叉参考。
使用方法
CEED数据集的使用方法主要涉及机器学习和云计算应用。用户可以通过Hugging Face平台轻松访问数据集,并使用Git或datasets包进行下载。数据集已经成功用于训练GPD和PhaseNet等深度学习模型,并支持开发更先进的模型,如PhaseNet+和QuakeFormer。此外,数据集还支持在AWS云平台上进行大规模地震数据分析,利用云计算的资源弹性,提高数据访问速度和处理效率。
背景与挑战
背景概述
加州地震事件数据集(CEED)是一个综合性的地震数据集,旨在支持机器学习和云计算在地震学中的应用。该数据集由加州大学伯克利分校的伯克利地震实验室和加州理工学院地震实验室的研究人员共同创建,整合了自2000年至2024年间来自北加州地震数据中心(NCEDC)和南加州地震数据中心(SCEDC)的地震记录。CEED数据集包括自动和手动确定的参数,如地震发生时间、震源位置、P/S波到达时间、初动极性和地面运动强度测量等。该数据集采用基于事件的格式,便于与事件目录进行交叉引用,并支持未来年份的持续更新。这一全面的开源数据集旨在支持各种应用,包括开发深度学习模型、创建增强的目录产品以及研究地震过程、断层区结构和地震风险。
当前挑战
CEED数据集面临的挑战包括:1)地震目录中的错误标签可能会影响模型训练和性能;2)数据集中缺少非目录事件的标签,需要进一步过滤和识别;3)数据集的不平衡分布,如震级、震源深度、信噪比等,可能限制模型对其他地区和不同类型地震的泛化能力。此外,随着数据量的不断增长,需要建立稳健的质量控制机制来维护数据完整性,并防止模型训练和应用中出现偏差。未来,将探索自动标签校正机制,并考虑将分布式声学传感(DAS)和GPS数据等更多类型的数据集成到数据集中,以扩大其应用范围。
常用场景
经典使用场景
加州地震事件数据集(CEED)的经典使用场景包括地震预测、地震学研究和地震监测。该数据集提供了丰富的地震事件记录,包括地震的起源时间、位置、震级、P/S波到达时间、初动极性和地面运动强度测量等参数。通过分析这些数据,研究人员可以更好地理解地震发生的过程、地震带的构造和地震风险。此外,CEED还可以用于训练深度学习模型,以提高地震检测和定位的准确性。
衍生相关工作
CEED衍生了许多相关工作,如GPD、PhaseNet和PhaseNO等深度学习模型。这些模型可以用于地震检测、定位和预测,并通过分析CEED中的地震事件记录来提高其准确性。此外,CEED还可以用于研究地震发生的物理机制和地震带的构造,以更好地理解地震风险。
数据集最近研究
最新研究方向
该数据集的最新研究方向包括利用深度学习技术进行地震事件的检测、定位和震源机制解算,以及通过云计算平台进行大规模地震数据分析。这些研究旨在提高地震监测的准确性和效率,并帮助科学家更好地理解地震过程和地震风险。
相关研究论文
  • 1
    California Earthquake Dataset for Machine Learning and Cloud Computing加州大学伯克利分校地震学实验室,加州理工学院地震学实验室 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作