five

NLPLabNTUST/Merged-CWA

收藏
Hugging Face2025-02-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/NLPLabNTUST/Merged-CWA
下载链接
链接失效反馈
官方服务:
资源简介:
CWA Benchmark是一个来自台湾的地震研究数据集,包含CWASN和TSMIP两个子数据集。数据集涵盖了2012年至2021年(CWASN)和2011年至2020年(TSMIP)的地震事件。CWASN子数据集包含5,849个事件和1,237,272条轨迹,而TSMIP子数据集包含12,306个事件和98,665条轨迹。数据集提供了p-picks和s-picks信息,采样率分别为100和200。此外,数据集还包含了多事件数据和测量单位(cm/s2和cm/s)。轨迹数据被分为五个不同级别,并提供了噪声样本。

The CWA Benchmark is a seismic research dataset from Taiwan, containing two sub-datasets: CWASN and TSMIP. The dataset covers seismic events from 2012 to 2021 (CWASN) and 2011 to 2020 (TSMIP). The CWASN sub-dataset includes 5,849 events and 1,237,272 traces, while the TSMIP sub-dataset includes 12,306 events and 98,665 traces. The dataset provides p-picks and s-picks information, with sampling rates of 100 and 200, respectively. Additionally, the dataset includes multi-event data and measurement units (cm/s2 and cm/s). The trace data is categorized into five different levels, and noise samples are also provided.
提供机构:
NLPLabNTUST
原始信息汇总

CWA Benchmark: 台湾地震研究数据集

数据集概述

  • 数据来源: CWASN 和 TSMIP
  • 事件数量:
    • CWASN: 5,849 个事件
    • TSMIP: 12,306 个事件
  • 地震波形数量:
    • CWASN: 1,237,272 条波形
    • TSMIP: 98,665 条波形
  • P波和S波拾取数量:
    • CWASN: 1,237,272 个 P 波拾取, 821,275 个 S 波拾取
    • TSMIP: 98,665 个 P 波拾取, 98,665 个 S 波拾取
  • 采样率:
    • CWASN: 100 Hz
    • TSMIP: 200 Hz
  • 多事件数量:
    • CWASN: 196,965 个多事件
    • TSMIP: 0 个多事件
  • 测量单位:
    • CWASN: cm/s², cm/s
    • TSMIP: cm/s²
  • 时间范围:
    • CWASN: 2012-2021 年
    • TSMIP: 2011-2020 年

波形分类

  • 分类依据: 由五个不同的拾取器分类为五个级别
  • 噪声样本: 包含噪声样本
  • 波形数量:
    • 级别 0: 三通道数据均为零
      • CWASN: 45,244 条
      • TSMIP: 9,620 条
    • 级别 1: 没有任何拾取器正确预测
      • CWASN: 174,720 条
      • TSMIP: 3,046 条
    • 级别 2: 地震信号中断
      • CWASN: 714 条
      • TSMIP: 0 条
    • 级别 3: 1 或 2 个拾取器正确预测
      • CWASN: 192,889 条
      • TSMIP: 3,487 条
    • 级别 4: 超过 3 个拾取器正确预测
      • CWASN: 823,705 条
      • TSMIP: 82,512 条
搜集汇总
数据集介绍
main_image_url
构建方式
NLPLabNTUST/Merged-CWA数据集的构建,源自我国宝岛台湾的中央气象局所收集的地震事件数据。该数据集整合了超过40种属性,包含了大约50万个地震图,这些数据来源于众多地震事件,特别是高震级事件。构建过程中,数据集的构建者采用了Seisbench框架,确保了数据的准确性和多样性。
特点
该数据集的一大特点是包含了丰富的地震事件数据,不仅数量庞大,而且种类繁多,涵盖了从2012年至2021年的地震事件。此外,数据集提供了详细的地震图及相关参数,如事件数量、迹线数量、震相拾取等,为地震学研究提供了宝贵的标注数据。数据集还提供了噪声样本,进一步丰富了其应用场景。
使用方法
使用NLPLabNTUST/Merged-CWA数据集,用户首先需要安装Seisbench和HuggingfaceHub。通过Seisbench的数据接口,用户可以方便地加载和操作数据集。用户可以根据需求,通过参数定制来选择不同的地震网络、合并版本、训练集和测试集的年份范围,从而灵活地使用该数据集进行地震学相关任务的研究和开发。
背景与挑战
背景概述
CWA(Central Weather Bureau)数据集,由我国台湾中央气象局收集,是一项旨在推动地震学研究的大型地震数据集。该数据集包含了大量的地震事件,特别是高震级事件,全面覆盖了40余种属性,并含有约50万条地震图,为各种地震学相关任务提供了宝贵的数据标签。该数据集的创建可追溯至近年来,由Kuan-Wei Tang等研究人员主导,并在2024年通过Seismological Research Letters进行了早期发表,对地震学领域产生了显著影响。
当前挑战
CWA数据集在研究领域中解决了地震事件分类和地震波形的识别等关键问题。然而,在构建过程中,研究人员面临着多方面的挑战,包括如何处理大量数据的有效存储与传输,以及如何确保数据标注的准确性和一致性。此外,数据集的多样性和质量对模型训练至关重要,这对于CWA数据集而言,是一个持续的挑战。
常用场景
经典使用场景
在地震学研究领域,NLPLabNTUST/Merged-CWA数据集以其丰富的地震事件记录和详尽的属性信息,成为了一个经典的研究工具。该数据集被广泛应用于地震事件的检测、分类和预测等任务中,特别是在高震级事件的研究上具有显著优势。
实际应用
在实际应用中,NLPLabNTUST/Merged-CWA数据集可用于地震监测系统的构建和优化,为地震预警提供技术支撑,同时对于地震后的灾害评估和救援决策也具有重要价值。
衍生相关工作
基于该数据集,已经衍生出一系列相关研究工作,包括地震事件的自动检测算法、地震波形数据的新处理技术以及地震预测模型的开发等,推动了地震学研究领域的科技进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作