ECG Segmentation and Overlap Dataset
收藏arXiv2025-06-12 更新2025-06-14 收录
下载链接:
https://github.com/masoudrahimi39/ECG-code
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由德黑兰大学电气与计算机工程学院的研究团队创建,旨在帮助训练深度学习模型,以准确地将心电图(ECG)图像数字化。数据集包括285个样本,其中100个样本包含人工验证的信号重叠,185个样本没有重叠。数据集分为两个子集:分割数据集和重叠数据集。分割数据集包含单个导联图像及其对应的真实掩模和原始时间序列信号。重叠数据集包含100个信号重叠样本和185个非重叠样本,用于评估模型在处理信号重叠情况下的性能。
This dataset was created by a research team from the School of Electrical and Computer Engineering, University of Tehran, with the objective of training deep learning models to accurately digitize electrocardiogram (ECG) images. The dataset consists of 285 total samples, 100 of which have manually verified signal overlaps, while the other 185 samples have no overlaps. It is divided into two subsets: the segmentation subset and the overlapping subset. The segmentation subset contains single-lead ECG images along with their corresponding ground-truth masks and raw time-series signals. The overlapping subset includes 100 signal-overlap samples and 185 non-overlap samples, designed to evaluate model performance when processing signal overlap scenarios.
提供机构:
德黑兰大学电气与计算机工程学院
创建时间:
2025-06-12
搜集汇总
数据集介绍

构建方式
该数据集的构建采用了一种创新的两阶段流程,旨在解决心电图(ECG)图像中信号重叠的挑战。首先,通过基于U-Net架构的深度学习分割网络,对包含信号重叠的ECG图像进行精确分割,训练数据特别加入了重叠信号样本及自定义数据增强技术(如OverlaySignal)。其次,利用信号处理技术将分割后的二值掩码转换为时间序列信号,并通过自适应网格检测模块确保对不同ECG格式和扫描分辨率的适应性。整个构建过程在开源框架下完成,确保了数据的可重复性和透明度。
特点
ECG Segmentation and Overlap Dataset的核心特点在于其专注于处理ECG图像中的信号重叠问题,这在现有数据集中较为罕见。数据集包含大量人工合成的ECG图像样本,其中特别设计了一部分样本包含相邻导联的信号重叠,而对应的真实掩码则保持“干净”,仅标记目标波形。此外,数据集还提供了多种格式的标注,包括PNG/BMP格式的掩码和JSON格式的原始时间序列信号,为研究者提供了丰富的实验材料。数据集的多样性和针对性使其成为评估ECG信号分割和重叠处理算法的理想选择。
使用方法
该数据集的使用方法主要围绕其两阶段处理流程展开。研究者首先可以利用分割数据集训练深度学习模型,如U-Net,以学习从复杂背景中准确分割ECG信号。随后,通过重叠数据集评估模型在信号重叠情况下的性能。数据集提供的网格检测和信号数字化模块可直接应用于实际ECG图像的转换过程。此外,开源代码库中提供的Python实现允许用户快速部署整个流程,包括数据预处理、模型训练和结果评估,极大简化了研究复现和进一步开发的难度。
背景与挑战
背景概述
ECG Segmentation and Overlap Dataset由德黑兰大学电气与计算机工程学院的研究团队于2025年创建,旨在解决心电图(ECG)图像数字化中的关键难题——信号重叠问题。该数据集作为深度学习算法开发的基准工具,重点关注单导联ECG图像中信号相互干扰的复杂场景。研究团队通过合成数据生成框架构建了包含四种专业子集的数据体系,其中重叠数据集专门模拟了临床常见的多导联信号交叉现象。这项工作显著推进了纸质ECG记录向可分析数字信号的转化技术,为心血管疾病诊断研究提供了重要的数据基础。
当前挑战
该数据集主要应对两大核心挑战:在领域问题层面,传统ECG数字化方法对信号重叠情况处理能力有限,导致波形重建准确率显著下降,而该数据集通过精心设计的重叠样本和定制增强策略,将重叠信号的皮尔逊相关系数提升至0.96以上;在构建过程中,研究团队需要精确模拟真实临床环境中多样化的信号干扰模式,同时保持基础ECG波形的生理合理性,为此开发了OverlaySignal等专业数据增强技术,并建立严格的质量控制流程确保合成数据与真实临床场景的等效性。
常用场景
经典使用场景
ECG Segmentation and Overlap Dataset 在医学图像处理和心血管疾病研究领域具有重要应用价值。该数据集专为心电图(ECG)图像数字化任务而设计,特别关注信号重叠这一常见但长期被忽视的技术难题。通过提供包含大量信号重叠样本的训练数据,该数据集为开发鲁棒的深度学习模型奠定了坚实基础,使得研究人员能够训练出能够准确分割重叠ECG信号的神经网络。
实际应用
在实际临床应用场景中,该数据集支持开发的算法可直接用于医院档案室保存的大量纸质ECG记录的数字化工作。通过将历史记录转化为可分析的时间序列数据,不仅实现了医疗数据的长期保存,更为心血管疾病的回顾性研究、流行病学调查以及个性化医疗提供了数据支持。算法对扫描质量差异和不同格式ECG纸的适应能力,使其在各类医疗机构都具有实用价值。
衍生相关工作
基于该数据集衍生的经典工作包括多模态ECG分析系统的开发。相关研究扩展了原始数据集的应用范围,如Wu等人将U-Net架构与自适应网格检测模块结合,开发出全自动ECG数字化流程;Demolder团队则利用该数据集训练生成对抗网络,进一步提高了在低质量图像上的分割精度。这些工作共同推动了从静态图像到动态生理信号分析的技术演进。
以上内容由遇见数据集搜集并总结生成



