five

UTDQuake

收藏
Hugging Face2026-01-27 更新2026-01-28 收录
下载链接:
https://huggingface.co/datasets/ecastillot/UTDQuake
下载链接
链接失效反馈
官方服务:
资源简介:
UTDQuake是由德克萨斯大学达拉斯分校提供的地震数据集,包含来自多个地震监测网络的事件、台站和拾取数据。数据集以网络为单位组织,每个网络包含事件信息和拾取数据(如可用)。数据文件以Parquet格式存储,便于高效访问和处理。该数据集适用于地震学研究、地震监测和地震波分析等任务。用户可以通过提供的Python代码示例快速加载数据、查询事件信息、获取拾取数据以及生成各种统计图表。数据集采用GPL-3.0许可证发布。
创建时间:
2026-01-22
原始信息汇总

UTDQuake 数据集概述

基本信息

  • 数据集名称: UTDQuake
  • 完整描述: University of Texas at Dallas Earthquake Dataset
  • 主页: https://github.com/ecastillot/UTDQuake
  • 许可证: gpl-3.0
  • 标签: seismology, earthquake

作者

  • Emmanuel Castillo (edc240000@utdallas.edu)
  • Nadine Ushakov
  • Marine Denolle

数据集内容与结构

数据集包含以下配置,每个配置的数据文件均以Parquet格式存储。

配置1: 0_network

  • 数据文件:
    • stats: manifests/stats.parquet

配置2: 1_stations

  • 数据文件: 按网络划分的多个文件,路径格式为 manifests/stations/network={NETWORK_CODE}.parquet
  • 涵盖的网络代码: AEIC, AFAD, ANF, ATH, AUST, BEO, BER, BGS, BUC, BYKL, CATAC, CNRM, DJA, EAF, ECX, EST, ETH, FUNV, GCG, GEOFON, GFZ, GII, HEL, IDC, IGQ, INET, INMG, IPGP, ISC, ISK, ISN, JAPAN, JSN, KMA, KNET, KRNET, KRSC, KRSZO, LDG, MDD, MEX, MRB, NIC, NNC, NOA, NOU, OSPL, OTT, PDG, PRE, RHSSO, RSNC, RSPR, SJA, TAP, THE, TIR, TUN, UCC, UCR, UPA, UPP, USP, VAO, VIE, ZUR, admin, ak, at, av, hv, mb, nc, nm, nn, ok, pr, se, tx, us, uu, uw。

配置3: 2_events

  • 数据文件: 按网络划分的多个文件,路径格式为 manifests/events/network={NETWORK_CODE}.parquet
  • 涵盖的网络代码: 与 1_stations 配置列表完全一致。

配置4: 3_picks

  • 数据文件: 按网络划分的多个文件,路径格式为 manifests/picks/network={NETWORK_CODE}.parquet
  • 涵盖的网络代码: 与 1_stations 配置列表完全一致。

数据内容说明

  • events/ 目录下包含按网络分组的压缩数据集文件(*.zip)。
  • 每个网络的数据集包含事件(event)和拾取(pick)信息(在可用的情况下)。

快速使用示例

数据访问

python import utdquake as utdq bank = utdq.load_network("tx") print(bank.stats) df = bank.read_index() ev_ids = df["event_id"].tolist()[:5] picks = bank.get_picks(event_ids=ev_ids)

目录操作

python catalog = bank.get_events(starttime=UTCDateTime("2025-07-31T00:00:00"), endtime=UTCDateTime("2025-07-31T12:00:00")) event = catalog[0] picks = event.picks_to_df() arrivals = event.arrivals_to_df()

拾取数据操作

python bank.save_picks() picks = bank.load_picks()

绘图功能

python bank.plot_overview("./overview.png") bank.plot_uncertainty_boxplots("./uncertainty_boxplots.png") bank.plot_station_location_uncertainty("./station_location_uncertainty.png") bank.plot_stats("./stats.png") bank.plot_pick_histograms("./histograms.png") bank.plot_pick_stats("./pick_stats.png")

搜集汇总
数据集介绍
main_image_url
构建方式
在地震学领域,构建高质量的地震数据集对于深入理解地壳活动规律至关重要。UTDQuake数据集通过系统性地整合全球众多地震监测网络的观测数据而形成,其构建过程体现了严谨的科学方法。该数据集以网络为单位,将不同机构提供的地震事件、台站信息以及震相拾取数据进行了标准化处理与归档。数据来源涵盖了AEIC、GEOFON、ISC等数十个国际知名地震网络,确保了数据来源的广泛性与权威性。构建过程中,原始数据被转换为统一的Parquet格式,并按照网络标识进行逻辑分割,形成了结构清晰、便于查询的数据存储体系。这种模块化的构建方式不仅保障了数据的完整性与一致性,也为后续的大规模数据分析奠定了坚实基础。
特点
UTDQuake数据集作为地震学研究的重要资源,其显著特点在于其高度的集成性与结构化组织。数据集囊括了全球范围内多个地震网络的观测记录,提供了事件、台站和震相拾取三个核心维度的信息,形成了多层次的数据架构。数据以网络为索引进行分区存储,使得用户能够便捷地按区域或机构筛选所需数据。此外,数据集采用了高效的列式存储格式,在保证数据读取速度的同时,也优化了存储空间。其内容不仅包含基础的地震参数,还涉及台站位置不确定性等元数据,为地震定位精度评估、波速模型反演等前沿研究提供了多维度的信息支撑。这种全面而细致的数据组织方式,极大地拓展了其在机器学习与统计地震学中的应用潜力。
使用方法
为充分发挥UTDQuake数据集在地震科研中的价值,其使用流程设计得直观且功能完备。用户可通过专用的Python库`utdquake`进行数据访问,首先指定目标网络代码(如“tx”)加载相应数据块,进而读取事件索引或获取特定时间窗口内的地震目录。数据集支持将原始数据转换为Obspy库兼容的Catalog与Event对象,便于进行专业的地震波形分析与处理。对于大规模震相数据,提供了专门的保存与加载接口,以应对海量拾取数据的高效管理。此外,库内集成了多种可视化功能,能够生成台站分布、定位不确定性统计以及震相参数直方图等分析图表,为研究人员提供了从数据加载、处理到结果呈现的一体化解决方案。
背景与挑战
背景概述
地震学作为地球物理学的核心分支,长期致力于通过地震波数据解析地球内部结构与地震活动规律。UTDQuake数据集由德克萨斯大学达拉斯分校的研究团队创建,其核心目标在于整合全球多源地震台网观测数据,构建一个统一、标准化的地震事件与震相拾取数据库。该数据集通过聚合AEIC、GEOFON、ISC等数十个国际台网的观测记录,为地震定位、震源机制反演及地震预警算法开发提供了关键的数据基础,显著提升了地震学研究的数据可及性与分析效率。
当前挑战
在地震学领域,精准的地震事件检测与震相拾取是构建可靠地震目录的核心挑战,传统方法常受限于数据异构性与噪声干扰。UTDQuake数据集的构建过程同样面临多重困难:全球台网数据格式与质量参差不齐,需进行复杂的标准化清洗与融合;海量连续波形数据中有效信号的提取与标注依赖大量人工校验,成本高昂;此外,不同区域台站分布不均导致地震定位精度存在空间差异,对数据集的完整性与一致性提出了严峻考验。
常用场景
经典使用场景
在地震学领域,UTDQuake数据集为研究人员提供了全球多网络地震事件的标准化记录。该数据集整合了来自AEIC、GEOFON、ISC等数十个地震监测网络的台站、事件和拾取数据,其经典使用场景在于构建统一的地震目录,并作为机器学习模型训练与验证的基准。通过其提供的Python接口,研究者能够便捷地加载特定区域或网络的数据,进行事件检索、震相拾取分析以及不确定性评估,从而支撑地震检测、定位和震级计算等核心任务的算法开发与性能比较。
解决学术问题
UTDQuake数据集有效解决了地震学研究中数据分散与格式不统一的长期挑战。它通过聚合全球多源地震数据,为地震检测算法的泛化能力评估、震源参数精确反演以及地震活动性统计分析提供了可靠的数据基础。该数据集的意义在于促进了地震监测技术的标准化进程,使得不同研究团队能够在同一数据平台上验证模型性能,推动了基于人工智能的地震自动处理技术的发展,并增强了我们对地震序列时空演化规律的理解。
衍生相关工作
围绕UTDQuake数据集,已衍生出多项经典研究工作,特别是在地震自动检测与相位拾取领域。例如,基于该数据集训练的深度学习模型(如PhaseNet、EQTransformer)实现了高精度的P波和S波识别,显著提升了地震目录的完备性。同时,研究人员利用其多网络数据开展了地震定位不确定性量化、各向异性层析成像以及地震序列聚类分析等探索。这些工作不仅推动了算法创新,也促进了地震学与数据科学的交叉融合,为构建下一代智能地震监测系统奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作