five

Stanford Earthquake Dataset (STEAD)|地震检测数据集|AI训练数据集

收藏
github2023-12-04 更新2024-05-31 收录
地震检测
AI训练
下载链接:
https://github.com/Panizghi/TECHTONICS
下载链接
链接失效反馈
资源简介:
STEAD数据集是一个全球性的地震信号集合,适合用于训练AI模型进行地震检测。它包含来自全球58个不同地震的超过13,000个地震图。每个地震图是一个由地震仪站记录的3分量、4秒波形。数据集包含约71,500个噪声样本和196,322个地震信号,总计267,822个数据集样本。

The STEAD dataset is a global collection of seismic signals, suitable for training AI models for earthquake detection. It includes over 13,000 seismograms from 58 different earthquakes worldwide. Each seismogram is a 3-component, 4-second waveform recorded by a seismograph station. The dataset comprises approximately 71,500 noise samples and 196,322 seismic signals, totaling 267,822 dataset samples.
创建时间:
2023-03-12
原始信息汇总

数据集概述

数据集名称

斯坦福地震数据集(STEAD)

数据集内容

  • 包含超过13,000个地震波形记录,来自全球58个不同地震。
  • 每个波形记录为3分量、4秒的波形,由地震仪站记录。

数据集规模

  • 总样本数:267,822
  • 噪声样本:71,500(约占36%)
  • 地震信号样本:196,322(约占64%)

数据集用途

用于训练AI模型进行地震检测。

数据集下载

斯坦福地震数据集

模型概述

分类CNN模型

  • 卷积层:32个滤波器,(5,5)核大小,ReLU激活。
  • 池化层:最大池化操作。
  • Dropout层:随机丢弃输入单元以防止过拟合。
  • Flatten层:将输出展平为一维向量。
  • 全连接层:ReLU激活。输出层为2个单元,使用softmax激活进行最终类别概率预测。

回归CNN模型

  • 卷积层:64个滤波器,(5,5)核大小,ReLU激活。
  • 池化层:最大池化操作。
  • Dropout层:随机丢弃输入单元以防止过拟合。
  • Flatten层:将输出展平为一维向量。
  • 全连接层:ReLU激活。输出层为1个单元,预测每个输入图像的值。

优化器与损失函数

分类CNN

  • 优化器:Adam,利用前一时间步的梯度计算当前步的学习率。
  • 损失函数:分类交叉熵。

回归CNN

  • 优化器:Adam,学习率为1e-5。
  • 损失函数:均方误差(MSE),常用于回归问题,对较大误差给予更重的惩罚。
AI搜集汇总
数据集介绍
main_image_url
构建方式
斯坦福地震数据集(STEAD)的构建基于全球范围内的地震信号采集,涵盖了来自58次不同地震的超过13,000条地震波记录。每条记录为3分量、4秒长的地震波形,由地震仪站记录。数据集经过精心筛选和处理,形成了包含71,500条噪声样本和196,322条地震信号的子集,总计267,822个样本。该数据集的构建旨在为地震检测的AI模型训练提供高质量的输入数据,确保模型能够有效区分地震信号与噪声。
特点
STEAD数据集的显著特点在于其广泛的地理覆盖和多样化的信号类型,涵盖了全球范围内的地震事件。数据集中的每条记录均为3分量、4秒长的地震波形,提供了丰富的信号特征。此外,数据集的样本比例经过精心设计,噪声样本与地震信号的比例约为36%对64%,确保了模型在训练过程中能够充分接触到不同类型的信号,从而提高模型的泛化能力。
使用方法
STEAD数据集适用于基于卷积神经网络(CNN)的地震检测模型训练。用户可以通过随机选择所需大小的图像数据,进行训练集与测试集的划分,随后编译并拟合CNN模型。模型评估后,可以保存训练过程中的部分模型,并生成评估图表。数据集支持分类和回归两种CNN模型,分别用于地震信号的分类和地震波特征的分析。用户可以根据具体需求调整模型参数,如卷积层、池化层和全连接层的设置,以优化模型性能。
背景与挑战
背景概述
斯坦福地震数据集(Stanford Earthquake Dataset, STEAD)是由斯坦福大学研究人员创建的一个全球性地震信号数据集,旨在为地震检测的AI模型训练提供高质量的数据支持。该数据集包含了来自全球58次不同地震的超过13,000个地震波记录,每个记录均为由地震仪站记录的3分量、4秒长的波形数据。STEAD数据集的构建为地震检测领域的研究提供了丰富的资源,尤其在利用卷积神经网络(CNN)进行地震信号分类和波形特性分析方面,具有重要的应用价值。
当前挑战
STEAD数据集在构建过程中面临了多个挑战。首先,地震信号的复杂性和多样性使得数据预处理和特征提取变得尤为困难。其次,数据集中地震信号与噪声信号的比例不均衡,如何有效处理这种类别不平衡问题是一个重要的挑战。此外,地震检测模型的训练需要大量的计算资源和时间,尤其是在处理大规模数据集时,模型的训练效率和收敛速度也是亟待解决的问题。最后,如何确保模型的泛化能力,使其在不同地震环境和条件下都能准确检测地震信号,也是该数据集应用中的一个关键挑战。
常用场景
经典使用场景
Stanford Earthquake Dataset (STEAD) 在地震检测领域中展现了其经典应用场景。通过卷积神经网络(CNN)模型,该数据集能够高效地对地震信号进行分类,区分地震波与噪声。此外,回归模型进一步分析地震波的特性,为地震预测和特征提取提供了强大的工具。
实际应用
在实际应用中,STEAD 数据集被广泛用于构建和优化地震检测系统。例如,在地震预警系统中,该数据集训练的模型能够快速识别地震信号,及时发出警报,减少人员伤亡和财产损失。此外,它还被用于地震监测网络的优化,提升全球地震监测的覆盖率和精度。
衍生相关工作
基于 STEAD 数据集,衍生了许多经典的研究工作。例如,研究者们开发了多种基于 CNN 的地震检测算法,显著提升了地震信号的分类精度。此外,该数据集还激发了对地震波特性分析的新方法,推动了地震学与其他领域的交叉研究,如机器学习在地球物理学中的应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Asteroids by the Minor Planet Center

包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。

github 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

Apple Stock Price Data

Historical stock price data for AAPL (apple)

kaggle 收录

New locus reveals the genetic architecture of sex reversal in the Chinese tongue sole (Cynoglossus semilaevis)

Sex reversal in insects, amphibians, reptiles, and fishes is a complicated and interesting biological phenomenon. Sex reversal changes the sex ratio of populations and may complicate breeding schemes. In the Chinese tongue sole (Cynoglossus semilaevis), genetic females may change into pseudomales, thereby increasing aquaculture costs because of the lower growth rate of the males than that of the females. Here, we identify a new locus associated with sex reversal; this single nucleotide polymorphism (SNP) is located in the third intron of the doublesex and mab-3 related transcription factor 1 (Dmrt1) gene on the Z chromosome (named Cyn_Z_8564889) and has two alleles, A and G. Cyn_Z_8564889 regulates sex reversal interactively with our previously detected SNP (Cyn_Z_6676874), with the genetic females simultaneously carrying the T allele of Cyn_Z_6676874 and the A allele of Cyn_Z_8564889 changing into pseudomales. Other Dmrt1 polymorphisms were detected, which formed two haplotypes. Two SN...

DataONE 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录