BenchECG

Name: BenchECG
Creator: 奥地利因斯布鲁克医科大学内科医学第三大学院心血管疾病实验室
Published: 2025-09-12 19:27:17
License: 暂无描述

arXiv2025-09-12 更新2025-11-24 收录

下载链接：

https://github.com/dlaskalab/bench-xecg

下载链接

链接失效反馈

官方服务：

资源简介：

BenchECG是一个标准化的基准，包括一系列公开可用的心电图数据集和多样化的任务。它涵盖了心血管诊断、监测和其他方面的信号类型，包括短期的12导联心电图、较长的2导联信号和单导联过夜记录。数据集来自不同的地理区域和人群，确保了模型在低数据和高数据环境下的评估。BenchECG包括多种临床相关任务，如分类、分割、检测、回归和生存分析，为心电图表示学习提供了一个严格的测试平台。

BenchECG is a standardized benchmark comprising a collection of publicly available electrocardiogram (ECG) datasets and diverse tasks. It covers signal types relevant to cardiovascular diagnosis, monitoring and other clinical scenarios, including short-term 12-lead ECGs, longer 2-lead signals, and single-lead overnight recordings. The datasets are sourced from diverse geographic regions and populations, enabling evaluation of models under both low-data and high-data scenarios. BenchECG includes multiple clinically relevant tasks such as classification, segmentation, detection, regression and survival analysis, providing a rigorous testbed for ECG representation learning.

提供机构：

奥地利因斯布鲁克医科大学内科医学第三大学院心血管疾病实验室

创建时间：

2025-09-12

搜集汇总

数据集介绍

构建方式

在心血管疾病诊断领域，标准化评估框架的缺失制约了心电图基础模型的可比性发展。BenchECG通过整合八个公开数据集构建评估体系，涵盖421,171名患者的1,674,704条记录，包含从静态12导联到动态单导联的多样化信号。数据采集严格遵循原始研究协议，采用统一预处理流程排除无效记录，并通过分层抽样确保不同地理区域与临床场景的代表性。

特点

该基准的核心价值体现在三维度的多样性架构：信号维度覆盖7秒至10小时的时长跨度与1-12导联的配置差异，任务维度囊括分类、分割、检测、回归与生存分析五类临床需求，人群维度横跨四大洲从健康个体到危重症患者的连续谱系。特别设计了分布外泛化测试，如基于巴西人群训练的年龄预测模型在德中美数据集上的验证，有效评估模型的跨群体适应能力。

使用方法

研究机构可通过线性探测与微调两种范式验证模型性能，其中线性探测保留预训练特征仅更新分类头，微调则允许全参数优化。评估采用标准化指标体系，包括分类任务的AUROC、检测任务的F1分数（20ms容差窗）、回归任务的对称平均绝对百分比误差等。基准提供完整的代码实现与数据划分方案，确保不同研究间结果的可比性与可复现性。

背景与挑战

背景概述

心血管疾病作为全球主要致死因素，推动了对心电图智能分析技术的迫切需求。BenchECG基准数据集由奥地利因斯布鲁克医科大学数字心脏病学实验室于2025年9月发布，旨在解决心电图基础模型领域缺乏标准化评估体系的核心问题。该数据集整合了来自全球8个公开心电数据库的42万患者数据，涵盖从静态12导联到动态单导联、从秒级到小时级的多维度信号特征，通过十类临床任务构建了迄今最全面的心电模型评估框架，为推进可解释医疗人工智能发展奠定了重要基石。

当前挑战

在心电图基础模型领域，现有方法面临评估体系碎片化的根本挑战：不同研究采用异构任务组合与数据预处理流程，导致模型性能难以横向比较。构建过程中需克服多源数据融合的技术壁垒，包括处理从100Hz至500Hz的异构采样率、协调1至12导联的维度差异、以及整合从常规静息检测到高强度运动监测的多样化采集环境。模型架构设计还需突破长序列处理瓶颈，传统Transformer在分析小时级动态心电信号时存在二次方复杂度缺陷，而卷积网络在时序精细定位任务中表现局限，亟需新型架构平衡计算效率与表征能力。

常用场景

经典使用场景

在心血管疾病智能诊断研究领域，BenchECG数据集通过整合八个公开心电图数据库构建了标准化评估体系。该数据集最经典的应用场景在于系统评估心电图基础模型的泛化能力，涵盖从短时12导联临床心电图到长时单导联监测信号的多样化数据形态。研究者可利用其统一框架在心律失常分类、睡眠呼吸暂停分割、R波峰值检测等十个任务上开展对比实验，有效解决了传统评估中因任务选择局限和数据不一致导致的模型性能可比性难题。

衍生相关工作

BenchECG的发布催生了系列创新性研究工作，其中最具代表性的是基于xLSTM架构的xECG模型。该模型通过结合扩展长短期记忆网络的高效序列处理能力与SimDINOv2自监督学习框架，在长时心电图分析任务中显著超越传统Transformer模型。后续研究受此启发，相继开发出面向特定临床场景的衍生模型，如在睡眠呼吸暂停检测任务中改进的时序建模方法，以及在光电容积描记信号分类任务中增强的跨模态迁移技术。这些工作共同推动了心电图基础模型在计算效率与临床适用性方面的协同发展。

数据集最近研究