five

RR seg_AFxls 和 RR seg_nonAF.xls

收藏
github2024-04-05 更新2024-05-31 收录
下载链接:
https://github.com/Luious-LYH/atrial-fibrillation
下载链接
链接失效反馈
官方服务:
资源简介:
数据集总共包含 40484 条心电 RR 间期序列,每条序列由30个 RR 间期值组成。其中数据集 RR_scg_AFls.xls 包含17247条房额信号的 RR 间期序列值,数据集 RR_seg_nonAF.xls包含23237 条非房颤信号的 RR 间期序列值,原数据集中每条 RR 序列(每一行)都为30个RR间期值。

The dataset comprises a total of 40,484 electrocardiogram (ECG) RR interval sequences, each consisting of 30 RR interval values. Specifically, the dataset RR_scg_AFls.xls contains 17,247 RR interval sequences of atrial fibrillation signals, while the dataset RR_seg_nonAF.xls includes 23,237 RR interval sequences of non-atrial fibrillation signals. In the original dataset, each RR sequence (each row) is composed of 30 RR interval values.
创建时间:
2024-04-05
原始信息汇总

数据集概述

数据集名称

基于机器学习模型分类心电房颤数据

数据集组成

  • RR_seg_AFxls: 包含17247条房颤信号的RR间期序列值。
  • RR_seg_nonAF.xls: 包含23237条非房颤信号的RR间期序列值。

数据集特征

  • 每条RR序列(每一行)包含30个RR间期值。
  • 数据集总计40484条心电RR间期序列。

数据集用途

  • 作为竞赛的训练集,用于特征提取和模型训练。

特征预处理

  • 提取了八个特征属性:均值、标准差、最小值、最大值、范围、中值、方差、熵。
  • 未对30维源数据进行PCA降维,因为不降维时的正确率最高。

模型训练

  • 贝叶斯分类器: 使用十折交叉验证,最佳属性组合的正确率为83%。
  • KNN模型算法: 使用十折交叉验证,调参后的最高正确率为89.75%。
  • 神经网络MLPClassifier: 使用十折交叉验证,选择6个重要特征属性,最高正确率达到90.23%。加上KFold的十折交叉验证,正确率最高达94%。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集构建于心电信号分析领域,旨在通过机器学习模型分类房颤与非房颤信号。数据集包含40484条心电RR间期序列,每条序列由30个RR间期值组成。其中,RR_seg_AF.xls包含17247条房颤信号序列,RR_seg_nonAF.xls包含23237条非房颤信号序列。数据集的构建过程包括从原始心电信号中提取RR间期序列,并将其分为房颤与非房颤两类,为后续的特征提取和模型训练提供了基础。
特点
该数据集的特点在于其高维度和丰富的特征信息。每条RR间期序列包含30个连续的心电信号间期值,能够有效反映心电信号的动态变化。通过对这些序列进行特征提取,获得了均值、标准差、最小值、最大值、范围、中值、方差和熵等八个关键特征。这些特征不仅能够捕捉心电信号的基本统计特性,还能够反映信号的复杂性和不确定性,为房颤信号的分类提供了多维度的信息支持。
使用方法
该数据集的使用方法主要围绕特征提取和模型训练展开。首先,从原始RR间期序列中提取八个关键特征,并将其存储为Excel文件。随后,利用贝叶斯分类器、KNN模型和神经网络MLPClassifier等机器学习算法进行模型训练和验证。在模型训练过程中,采用了十折交叉验证的方法,以确保模型的泛化能力。通过不断调整模型参数和特征选择,最终实现了高达94%的分类正确率,展示了该数据集在房颤信号分类中的强大潜力。
背景与挑战
背景概述
RR seg_AFxls 和 RR seg_nonAF.xls 数据集是专为心电房颤信号分类研究而设计的数据集,包含40484条心电RR间期序列,每条序列由30个RR间期值组成。该数据集由17247条房颤信号和23237条非房颤信号构成,旨在通过机器学习模型对房颤信号进行有效分类。数据集的设计和发布为心电信号处理领域的研究提供了重要的数据支持,推动了房颤自动检测技术的发展。该数据集的应用不仅提升了房颤检测的准确性,还为相关算法的优化和验证提供了坚实的基础。
当前挑战
该数据集在应用过程中面临多重挑战。首先,房颤信号的复杂性使得特征提取和分类模型的构建变得困难,尽管提取了八个特征属性,但分类器的正确率仍有提升空间。其次,数据预处理阶段的降维操作并未显著提升模型性能,反而在某些情况下降低了正确率,这表明特征选择和降维策略需要进一步优化。此外,不同分类器(如贝叶斯分类器、KNN和神经网络)在数据集上的表现差异较大,如何选择最佳模型及其参数配置仍是一个亟待解决的问题。最后,数据归一化对模型性能的影响显著,如何在保持数据特性的同时进行有效归一化,也是未来研究的关键方向。
常用场景
经典使用场景
RR seg_AFxls 和 RR seg_nonAF.xls 数据集在心电信号处理领域中被广泛用于房颤(AF)与非房颤(non-AF)信号的分类研究。通过对30个RR间期序列的分析,研究者能够利用机器学习模型如贝叶斯分类器、KNN和神经网络MLPClassifier,进行高效的心律失常检测。这一数据集的使用场景主要集中在医疗健康领域,特别是在心脏病的早期诊断和监测中,提供了重要的数据支持。
实际应用
在实际应用中,RR seg_AFxls 和 RR seg_nonAF.xls 数据集被用于开发智能心电监测系统。这些系统能够实时分析患者的心电信号,自动识别房颤等异常心律,从而为医生提供及时的诊断建议。此外,该数据集还被用于优化现有的心电图分析算法,提升医疗设备的性能和可靠性,最终改善患者的生活质量。
衍生相关工作
基于RR seg_AFxls 和 RR seg_nonAF.xls 数据集,研究者们开展了多项经典工作。例如,利用贝叶斯分类器和KNN算法进行特征选择和分类优化,以及通过神经网络MLPClassifier实现更高精度的信号分类。这些工作不仅推动了心电信号处理领域的技术进步,还为后续的研究提供了宝贵的经验和数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作