five

PAECG: Pet Arrhythmia ElectroCardioGram Dataset

收藏
github2026-03-27 更新2026-03-28 收录
下载链接:
https://github.com/LichtExtx/Pet-Arrhythmia-ElectroCardioGram-Dataset-PA-ECG-
下载链接
链接失效反馈
官方服务:
资源简介:
PAECG是一个专为兽医心脏病学设计的全面、专家注释且公开可用的可穿戴心电图数据集。它包含来自犬科和猫科动物的高保真1D ECG信号,旨在加速自动化心律失常检测算法和半监督学习模型的开发。数据集包含40个受试者(39只犬科动物,1只猫科动物),共2611个有效片段,每个片段长度为6秒,采样率为500 Hz(每个片段3000个数据点)。数据集提供了片段级多标签疾病分类、信号质量分级(A/B/C)以及点级P、R和T峰值索引。

PAECG is a comprehensive, expert-annotated, publicly available wearable electrocardiogram (ECG) dataset designed for veterinary cardiology. It contains high-fidelity 1D ECG signals from canine and feline subjects, aiming to accelerate the development of automated arrhythmia detection algorithms and semi-supervised learning models. The dataset includes 40 subjects (39 canines and 1 feline), totaling 2611 valid segments, each with a duration of 6 seconds and a sampling rate of 500 Hz (equivalent to 3000 data points per segment). It provides segment-level multi-label disease classification, signal quality grading (A/B/C), and point-level P, R, and T peak indices.
创建时间:
2026-03-27
原始信息汇总

PAECG 宠物心律失常心电图数据集概述

数据集基本信息

  • 数据集名称:PAECG (Pet Arrhythmia ElectroCardioGram Dataset)
  • 作者:Po-An Shih
  • 简介:PAECG 是一个专为兽医心脏病学设计的、经过专家标注的、公开可用的可穿戴心电图数据集。它包含来自犬类和猫科动物的高保真一维心电图信号,旨在加速自动心律失常检测算法和半监督学习模型的开发。

数据规模与规格

  • 受试者:40 个受试者(39 只犬,1 只猫)
  • 有效片段总数:2,611 个
  • 片段长度:每个文件 6 秒
  • 采样率:500 Hz(每个片段 3,000 个数据点)
  • 导联配置:标准 II 导联(可穿戴贴片)

标注信息

  • 标注级别:片段级多标签疾病分类、信号质量分级(A/B/C)以及点级的 P、R、T 波峰值索引。
  • 疾病类别(多标签):正常、窦性心动过速、左束支传导阻滞、二度房室传导阻滞、三度房室传导阻滞、左心室肥大、房性早搏、导联反接、伪影、T 波倒置。

数据文件与结构

数据集提供两种组织版本:

  1. 扁平文件版本 (PAECG_ALL.zip):包含所有 6 秒心电图片段的单个目录,适用于快速深度学习流水线。
  2. 分层文件夹版本 (PAECG_SPLIT.zip):按受试者组织的分层目录,包含完整的连续原始信号、峰值索引文件以及独立的 6 秒窗口文件夹,适用于详细的临床或时间序列分析。

核心文件说明

  • 元数据文件 (PAECG_metadata.csv):包含训练 AI 模型的核心映射信息,列包括文件名、受试者人口统计学信息、信号完整性标志、信号质量等级以及所有诊断标签的二进制标志。
  • 信号文件 (electrography_*.txt):每个文本文件包含一个一维幅度值数组(单位为 mV)。一个有效的 6 秒片段恰好包含 3,000 个以换行符分隔的浮点数。
  • 峰值索引文件 (*peaks_*.txt):包含 P、R 或 T 波峰值出现的整数索引(对于 6 秒片段,范围从 0 到 2999)。这些文件位于 PAECG_SPLIT 存档中。

使用与基准

  • 快速开始:提供了使用 Python (pandas, numpy) 加载心电图片段、标签和点级标注的示例代码。
  • 基准训练:提供了基于 1D-ResNet 架构的基线实现。运行 5 折交叉验证基线需执行 python train.py

引用与许可

  • 引用:若在研究中使用 PAECG 数据集或基准代码,请引用相关论文。
  • 许可证:本数据集免费供学术和非商业研究使用。

联系方式

  • Po-An Shih (lichtextx756@gmail.com)
  • Shuenn-Yuh Lee (ieesyl@mail.ncku.edu.tw)
搜集汇总
数据集介绍
main_image_url
构建方式
在兽医心脏病学领域,高质量心电数据的稀缺性长期制约着自动心律失常检测算法的发展。PAECG数据集的构建过程体现了严谨的科研范式,其核心数据来源于40只宠物(39只犬与1只猫)佩戴标准II导联可穿戴贴片所采集的高保真心电信号。专家团队对原始连续信号进行了系统性的分割与标注,生成了2611个时长为6秒的有效片段,采样率统一为500赫兹。每个片段均获得了多层次的注释:在节段层面,进行了多标签疾病分类与信号质量分级;在点层面,则精确标记了P波、R波与T波的峰值位置索引。这种结构化的构建方式确保了数据在深度学习研究与临床分析中的双重可用性。
特点
PAECG数据集以其专业性与完整性在兽医生物信号领域脱颖而出。其首要特点在于提供了精细的多层级标注体系,不仅包含十种常见心律失常与正常节律的多标签分类,还附有专家判读的信号质量等级(A/B/C),以及精确到采样点的P、R、T波峰位置,为模型开发提供了丰富的监督信息。其次,数据集以两种互补的格式发布:扁平化的`PAECG_ALL`版本便于快速构建深度学习流水线;而按受试者分层的`PAECG_SPLIT`版本则保留了完整的原始连续信号及对应峰值索引,支持深入的时序分析与临床研究。所有数据均采用标准的CSV与TXT格式,极大降低了数据解析的技术门槛。
使用方法
为便利研究者快速开展实验,数据集提供了清晰的元数据映射与简洁的代码示例。使用流程始于加载核心的`PAECG_metadata.csv`文件,该文件将每个信号文件与对应的诊断标签、受试者信息及信号质量关联起来。研究者可通过筛选`is_complete`标志获取有效数据,并利用`pandas`与`numpy`等工具加载对应的TXT格式信号文件,其中存储着长度为3000的一维振幅数组。为优化模型训练,通常建议对信号进行Z-score标准化处理。此外,仓库附带了基于1D-ResNet架构的基线训练脚本,支持五折交叉验证,为算法性能评估提供了可复现的基准。整个数据访问与处理流程设计得直观高效,旨在加速宠物心律失常自动诊断技术的创新。
背景与挑战
背景概述
在兽医心脏病学领域,心律失常的精准诊断长期依赖于专业医师对心电图信号的解读,这一过程既耗时又易受主观因素影响。PAECG数据集由Po-An Shih等人于2026年创建,并伴随IEEE数据描述论文发布,旨在为宠物心律失常的自动检测提供高质量、专家标注的穿戴式心电图数据资源。该数据集收录了来自40只宠物(包括39只犬类和1只猫类)的2611个有效心电图片段,每个片段时长为6秒,采样率为500赫兹,并提供了片段级的多标签疾病分类、信号质量分级以及点级的P波、R波和T波峰值索引。通过提供标准化的Lead II导联穿戴贴片数据,PAECG不仅推动了兽医心脏病学中机器学习模型的发展,特别是半监督学习算法的进步,还为跨物种心血管疾病研究奠定了重要的数据基础。
当前挑战
PAECG数据集致力于解决兽医心电图自动分析中的核心挑战,即如何在复杂生理噪声和个体差异背景下实现高精度、多类别的心律失常识别。具体而言,数据标注涉及十种疾病状态的多标签分类,包括正常窦性心律、窦性心动过速、左束支传导阻滞、二度及三度房室传导阻滞等,这要求模型具备区分细微波形特征和应对类别不平衡的能力。在构建过程中,挑战主要源于数据采集的实践困难:穿戴式设备在活动宠物身上易产生运动伪影和电极接触噪声,导致信号质量波动;同时,宠物品种、年龄和体型差异引入了显著的生理变异性,使得标准化预处理和特征提取变得复杂。此外,确保专家级标注的一致性与可靠性,特别是在模糊波形或复合心律失常案例中,也构成了重要的质量控制难题。
常用场景
经典使用场景
在兽医心脏病学领域,PAECG数据集为开发自动化心律失常检测算法提供了关键支持。该数据集包含犬类和猫类的高保真心电图信号,其经典使用场景集中于训练和验证深度学习模型,特别是针对一维时间序列分析的神经网络架构。研究人员利用这些标注精细的六秒心电图片段,能够高效构建分类模型,以识别多种心律失常类型,如左束支传导阻滞和房性早搏,从而推动兽医诊断工具的智能化进程。
实际应用
在实际应用中,PAECG数据集可直接服务于宠物健康监测设备的研发。基于该数据集训练的算法可集成至可穿戴心电图贴片,实现实时心律失常预警,帮助兽医进行远程诊断。例如,在家庭或诊所环境中,系统能自动检测窦性心动过速或房室传导阻滞等异常,及时提醒宠物主人就医。这不仅提高了诊断效率,还降低了宠物心脏病的管理成本,为个性化兽医护理提供了技术支撑。
衍生相关工作
围绕PAECG数据集,已衍生出一系列经典研究工作,其中基线的一维ResNet模型为后续算法比较设立了基准。许多研究在此基础上扩展,开发了针对多标签分类的图神经网络或时序卷积网络,以提升对复杂心律失常的识别精度。此外,该数据集还激发了跨域适应研究,例如将人类心电图分析技术迁移至宠物数据,推动了兽医人工智能领域的交叉创新。相关成果常见于生物医学工程与机器学习会议,持续丰富着心电图分析的学术图谱。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作