ECG-QA
收藏数据集概述
数据集名称: ECG-QA
数据集描述: ECG-QA 是一个结合心电图(ECG)的问答数据集,旨在为ECG分析提供专门的QA数据集。该数据集包含70个问题模板,覆盖广泛的临床相关ECG主题,每个问题模板都经过ECG专家验证,确保其临床实用性。
数据集版本:
- v1.0.2 (2024-04-11): 此版本修正了PTB-XL ECG-QA样本中的错误,并将“late stage of myocardial infarction”更正为“old stage of myocardial infarction”。此外,该版本还包含了基于MIMIC-IV-ECG的ECG-QA样本的重新采样,确保所有采样过程无误。
- v1.0.1: 主要更正了心肌梗死阶段的描述。
- v1.0.0: 初始版本。
数据集结构:
- 基于PTB-XL的原始版本: 包含多个CSV和TSV文件,以及用于训练、验证和测试的JSON文件。
- 基于MIMIC-IV-ECG的扩展版本: 结构与原始版本类似,但数据量更大,包含更多的ECG样本。
数据集属性:
- SCP代码: 155个,分为诊断、形态和节律相关症状。
- 噪声: 仅包含“Baseline Wander”。
- 梗死阶段: 通过解析机器生成的声明中的关键词(如early, recent, old)来推断。
- 心脏轴/数值特征: 通过提取P, Q, R, S, T波来计算。
数据集使用:
- 数据集提供了详细的文件结构和使用说明,包括如何通过Python脚本加载和处理数据。
- 提供了用于数据预处理和模型训练的示例代码和脚本。
数据集更新历史
- 2024年5月: 更正了PTB-XL ECG-QA样本中的错误。
- 2024年4月11日: 发布了v1.0.2,确保了基于MIMIC-IV-ECG的ECG-QA样本的采样过程无误。
- 2024年3月: 发布了v1.0.1,并添加了引用信息。
数据集示例
数据集提供了Google Colab Notebook和样本图像,以帮助用户快速了解数据集内容。
数据集文件结构
ecgqa ├── ptbxl │ ├── answers_for_each_template.csv │ ├── answers.csv │ ├── test_ecgs.tsv │ ├── train_ecgs.tsv │ ├── valid_ecgs.tsv │ ├── paraphrased │ │ ├─ test │ │ │ ├─ 00000.json │ │ │ │ ... │ │ │ └─ 80000.json │ │ ├─ train │ │ │ ├─ 00000.json │ │ │ │ ... │ │ │ └─ 260000.json │ │ └─ valid │ │ ├─ 00000.json │ │ │ ... │ │ └─ 60000.json │ └── template │ ├─ test │ │ ├─ 00000.json │ │ │ ... │ │ └─ 80000.json │ ├─ train │ │ ├─ 00000.json │ │ │ ... │ │ └─ 260000.json │ └─ valid │ ├─ 00000.json │ │ ... │ └─ 60000.json └── mimic-iv-ecg ├── ... └── (similar with the above)
数据集使用说明
提供了详细的使用指南,包括如何使用提供的Python脚本进行数据映射和预处理,以及如何运行实验和模型训练。




