five

us-earthquake

收藏
Hugging Face2024-10-04 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/tppllm/us-earthquake
下载链接
链接失效反馈
资源简介:
该数据集包含2020年1月1日至2023年12月31日期间在美国发生的地震事件。数据集包括3,009个序列,涵盖29,521个事件,涉及3种震级类型。原始数据可通过USGS地震搜索获取,数据预处理步骤的详细信息可在相关论文中找到。

This dataset contains seismic events that occurred in the United States between January 1, 2020 and December 31, 2023. It includes 3,009 sequences, covering 29,521 seismic events across 3 magnitude types. The raw data can be accessed via the USGS Earthquake Search, and detailed information on the data preprocessing steps can be found in the associated paper.
创建时间:
2024-10-04
原始信息汇总

U.S. Earthquake Dataset

概述

  • 数据集名称: U.S. Earthquake Dataset
  • 数据来源: 美国地质调查局(USGS)地震搜索
  • 数据时间范围: 2020年1月1日至2023年12月31日
  • 数据量: 包含3,009个序列,共29,521个事件
  • 震级类型: 3种

数据预处理

  • 预处理方法: 详细的数据预处理步骤可在这篇论文中找到

其他信息

  • 语言: 英语
  • 许可协议: CC0 1.0
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于美国地质调查局(USGS)的地震搜索平台,涵盖了2020年1月1日至2023年12月31日期间美国境内的地震事件。通过数据预处理步骤,原始地震数据被整理为3,009个序列,包含29,521个事件,并按照三种震级类型进行分类。数据集的构建过程在相关研究论文中详细描述,确保了数据的科学性和可靠性。
特点
该数据集的特点在于其广泛的时间跨度和丰富的事件类型,涵盖了多种震级的地震事件。数据经过精心处理,确保了序列的完整性和事件的准确性。此外,数据集提供了详细的元数据信息,便于研究人员进行深入分析和建模。其规模适中,适合用于时间点过程模型的研究和验证。
使用方法
该数据集可用于时间点过程模型的研究,特别是基于大语言模型的微调任务。研究人员可以通过加载数据集,提取地震事件序列,并结合相关论文中的方法进行模型训练和评估。使用该数据集时,建议引用相关研究论文,以确保学术规范。数据集的结构清晰,便于直接应用于机器学习或深度学习框架中。
背景与挑战
背景概述
U.S. Earthquake数据集由Zefang Liu和Yinzhu Quan于2024年创建,旨在为地震事件的时间点过程建模提供数据支持。该数据集涵盖了2020年1月1日至2023年12月31日期间美国境内的地震事件,包含3,009个序列和29,521个事件,涉及三种震级类型。数据来源于美国地质调查局(USGS)的地震搜索平台,并通过TPP-LLM和TPP-LLM-Embedding两篇论文中的预处理方法进行了优化。该数据集为地震预测、风险评估以及时间序列分析等领域提供了重要的数据基础,推动了相关研究的深入发展。
当前挑战
U.S. Earthquake数据集的核心挑战在于如何从复杂的地震事件中提取有效的时间序列特征,以支持时间点过程建模。地震事件具有高度随机性和非线性特征,如何准确捕捉其时间依赖性和空间分布规律是主要难题。此外,数据预处理过程中需解决数据噪声、缺失值以及多源数据融合等问题,以确保数据的一致性和可靠性。构建过程中还需考虑如何高效处理大规模地震数据,并设计合理的特征表示方法,以支持后续的模型训练和预测任务。这些挑战对数据集的构建和应用提出了较高的技术要求。
常用场景
经典使用场景
在自然灾害研究领域,地震数据的分析对于理解地震活动规律至关重要。us-earthquake数据集提供了2020年至2023年间美国境内的地震事件记录,包含3009个序列和29521个事件,覆盖了三种不同的震级类型。这一数据集为研究人员提供了一个详尽的资源,用于分析地震的时间分布、空间分布及其与地质构造的关系。
实际应用
在实际应用中,us-earthquake数据集被广泛用于地震风险评估和应急响应规划。政府和灾害管理机构利用这些数据来评估不同地区的地震风险,制定相应的防灾减灾策略。此外,该数据集还被用于开发地震预警算法,帮助减少地震带来的生命和财产损失。
衍生相关工作
基于us-earthquake数据集,研究人员开发了多种先进的地震分析模型和算法。例如,TPP-LLM模型通过高效微调大型语言模型来建模时间点过程,显著提升了地震序列预测的准确性。此外,TPP-LLM-Embedding模型则专注于从文本描述中高效检索时间事件序列,为地震数据的自动化处理提供了新的解决方案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作