seismic-bumps Data Set
收藏github2020-03-07 更新2024-05-31 收录
下载链接:
https://github.com/datasets/seismic-bumps
下载链接
链接失效反馈官方服务:
资源简介:
该数据集描述了煤矿中高能量(超过10^4焦耳)地震冲击的预测问题。数据来自波兰两个长壁煤矿。数据集中的每一行包含一个班次(8小时)内岩石中地震活动的总结声明。如果决策属性值为1,则表示在下一个班次记录到能量超过10^4焦耳的任何地震冲击。
This dataset addresses the prediction of high-energy (exceeding 10^4 joules) seismic impacts in coal mines. The data originates from two longwall coal mines in Poland. Each row in the dataset encapsulates a summary statement of seismic activity within the rock during an 8-hour shift. A decision attribute value of 1 indicates that any seismic impact exceeding 10^4 joules was recorded in the subsequent shift.
创建时间:
2018-01-03
原始信息汇总
数据集概述
数据集来源
- 数据集来源于seismic-bumps Data Set,描述了波兰某煤矿中高能量(高于10^4 J)地震冲击的预测问题。
数据集内容
- 实例数量:2584
- 属性数量:18 + 类别
- 缺失属性值:无
类别分布
- 危险状态(类别1):170(6.6%)
- 非危险状态(类别0):2414(93.4%)
字段描述
- seismic:使用地震方法在矿井作业中获得的地震危险评估结果。
- seismoacoustic:使用地震声学方法在矿井作业中获得的地震危险评估结果。
- shift:班次类型信息。
- genergy:前一班次由最活跃的地震仪(GMax)记录的地震能量。
- gpuls:前一班次GMax记录的脉冲数。
- gdenergy:前一班次GMax记录的能量与前八班次平均能量的偏差。
- gdpuls:前一班次GMax记录的脉冲数与前八班次平均脉冲数的偏差。
- ghazard:基于GMax仅注册的地震声学方法在矿井作业中获得的地震危险评估结果。
- nbumps:前一班次记录的地震冲击次数。 10-18. nbumps2-nbumps89:不同能量范围内的地震冲击次数。
- energy:前一班次记录的地震冲击总能量。
- maxenergy:前一班次记录的地震冲击的最大能量。
- class:决策属性,1表示下一班次发生高能量地震冲击(危险状态),0表示未发生(非危险状态)。
数据存储位置
- 数据存储在
data目录下的data/seismic-bumps.csv文件中。
搜集汇总
数据集介绍

构建方式
本数据集的构建基于波兰煤矿中两个长壁的工作数据,通过收集并整理了关于矿井中高能量(高于10^4 J)地震 bump 预测的相关信息。数据集包含了 seismic 和 seismoacoustic 监测方法得到的危害评估结果,以及与地震活动相关的各类参数,如能量记录、脉冲数量等,最终形成了包含 2584 个实例和 18 个属性的数据集,其中包含了类别标签,用以标识下一班次是否发生了高能量地震 bump。
特点
该数据集的主要特点在于其数据来源的实践性,直接关联煤矿安全中的地震危害预测问题。此外,数据集的类别分布极度不平衡,仅有 6.6% 的实例属于高能量地震 bump 的危险状态,这对于机器学习模型的训练和评估提出了挑战。数据集中的属性涵盖了地震和声学监测结果、班次类型、能量记录及其偏差、脉冲数量及其偏差、不同能量范围内的地震 bump 数量等,为研究地震危害预测提供了丰富的特征信息。
使用方法
使用该数据集时,首先需要了解每个字段的含义,包括地震和声学监测结果、能量记录、脉冲数量等。数据集以 CSV 格式存储,可以通过 Python 脚本进行处理和准备,例如去除重复行和头部描述信息。用户可以根据具体的研究需求,利用数据集中的特征进行机器学习模型的训练,以预测煤矿中的地震危害状态。
背景与挑战
背景概述
seismic-bumps数据集源于对煤矿中高地能(高于10^4 J)地震 bump 预测问题的研究。该数据集由位于波兰的一座煤矿中的两个长壁工作面收集而来。煤矿作业与危险的相伴而生,其中地震危害作为一种特殊威胁,在许多地下矿井中频繁发生。地震危害因其难以检测和预测,在自然危害中尤为棘手,其预测难度堪比地震预测。随着地震和声波监测系统的不断发展,对岩石质量过程的理解及地震危害预测方法的定义有了显著的提升。然而,目前方法的准确性仍远未达到完美,因此,探索新的更好的危害预测方法,尤其是运用机器学习手段,显得尤为重要。该数据集的创建,旨在推动此领域的研究进展,由Marek Sikora和Lukasz Wrobel等研究人员完成,并在《Archives of Mining Sciences》期刊发表相关研究成果。
当前挑战
seismic-bumps数据集在构建和应用过程中面临的挑战主要包括:数据集的不平衡分布,即正面(危险状态)和负面(非危险状态)样本分布悬殊,这对于地震危害预测是一个严重的问题。目前的方法仍然不足以实现预测的高敏感性和特异性。此外,数据集的属性包含了多个与地震活动相关的监测指标,如何有效利用这些指标进行准确的地震 bump 预测,是研究中的一个重要挑战。数据集的构建过程中,还需要解决如何处理和清洗原始数据,以及如何保持数据的质量和一致性等问题。
常用场景
经典使用场景
在地震学及煤矿安全领域,seismic-bumps数据集的典型应用场景在于预测煤矿中的高能量地震突跳(seismic bumps)。该数据集通过分析前一班次内地震活动记录,包括地震能量、脉冲数、不同能量级别的地震突跳次数等参数,旨在对下一班次是否会出现能量高于10^4 J的地震突跳进行预测。
衍生相关工作
基于seismic-bumps数据集的研究衍生出了多项相关工作,包括但不限于利用规则归纳算法分析煤矿地震监测系统收集的数据,这些研究进一步推动了地震学及煤矿安全领域的科技进步,对地震灾害的预防和控制提供了新的方法和思路。
数据集最近研究
最新研究方向
在地震波 bump 预测领域,该数据集针对矿井中高能量 seismic bump 的预测问题,提供了宝贵的实验数据。近期研究集中于利用机器学习算法提高对矿井 seismic hazard 的预测准确性,尤其是针对数据集中正负样本分布不均的挑战。研究者们正在探索如随机森林、支持向量机等高级算法,以提升预测模型的敏感性和特异性,从而为矿井安全提供更有效的预警机制。此外,通过对震波能量的监测与分析,研究人员旨在提高对岩爆发生概率的预测能力,进而指导矿井安全作业,降低安全事故风险。
以上内容由遇见数据集搜集并总结生成



