five

ECG-QA

收藏
github2024-05-18 更新2024-05-31 收录
下载链接:
https://github.com/Jwoo5/ecg-qa
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个专门为心电图(ECG)分析设计的问答数据集,包含70个覆盖广泛临床相关ECG主题的问题模板,每个问题都由ECG专家验证以确保临床实用性。数据集包括多样化的ECG解释问题,包括需要比较分析两个不同ECG的问题。

This is a specialized question-and-answer dataset designed for electrocardiogram (ECG) analysis, comprising 70 question templates that cover a wide range of clinically relevant ECG topics. Each question has been validated by ECG experts to ensure clinical utility. The dataset includes a variety of ECG interpretation questions, including those that require comparative analysis of two different ECGs.
创建时间:
2023-06-05
原始信息汇总

数据集概述

数据集名称: ECG-QA

数据集描述: ECG-QA 是一个结合心电图(ECG)的问答数据集,旨在为ECG分析提供专门的QA数据集。该数据集包含70个问题模板,覆盖广泛的临床相关ECG主题,每个问题模板都经过ECG专家验证,确保其临床实用性。

数据集版本:

  • v1.0.2 (2024-04-11): 此版本修正了PTB-XL ECG-QA样本中的错误,并将“late stage of myocardial infarction”更正为“old stage of myocardial infarction”。此外,该版本还包含了基于MIMIC-IV-ECG的ECG-QA样本的重新采样,确保所有采样过程无误。
  • v1.0.1: 主要更正了心肌梗死阶段的描述。
  • v1.0.0: 初始版本。

数据集结构:

  • 基于PTB-XL的原始版本: 包含多个CSV和TSV文件,以及用于训练、验证和测试的JSON文件。
  • 基于MIMIC-IV-ECG的扩展版本: 结构与原始版本类似,但数据量更大,包含更多的ECG样本。

数据集属性:

  • SCP代码: 155个,分为诊断、形态和节律相关症状。
  • 噪声: 仅包含“Baseline Wander”。
  • 梗死阶段: 通过解析机器生成的声明中的关键词(如early, recent, old)来推断。
  • 心脏轴/数值特征: 通过提取P, Q, R, S, T波来计算。

数据集使用:

  • 数据集提供了详细的文件结构和使用说明,包括如何通过Python脚本加载和处理数据。
  • 提供了用于数据预处理和模型训练的示例代码和脚本。

数据集更新历史

  • 2024年5月: 更正了PTB-XL ECG-QA样本中的错误。
  • 2024年4月11日: 发布了v1.0.2,确保了基于MIMIC-IV-ECG的ECG-QA样本的采样过程无误。
  • 2024年3月: 发布了v1.0.1,并添加了引用信息。

数据集示例

数据集提供了Google Colab Notebook和样本图像,以帮助用户快速了解数据集内容。

数据集文件结构

ecgqa ├── ptbxl │ ├── answers_for_each_template.csv │ ├── answers.csv │ ├── test_ecgs.tsv │ ├── train_ecgs.tsv │ ├── valid_ecgs.tsv │ ├── paraphrased │ │ ├─ test │ │ │ ├─ 00000.json │ │ │ │ ... │ │ │ └─ 80000.json │ │ ├─ train │ │ │ ├─ 00000.json │ │ │ │ ... │ │ │ └─ 260000.json │ │ └─ valid │ │ ├─ 00000.json │ │ │ ... │ │ └─ 60000.json │ └── template │ ├─ test │ │ ├─ 00000.json │ │ │ ... │ │ └─ 80000.json │ ├─ train │ │ ├─ 00000.json │ │ │ ... │ │ └─ 260000.json │ └─ valid │ ├─ 00000.json │ │ ... │ └─ 60000.json └── mimic-iv-ecg ├── ... └── (similar with the above)

数据集使用说明

提供了详细的使用指南,包括如何使用提供的Python脚本进行数据映射和预处理,以及如何运行实验和模型训练。

搜集汇总
数据集介绍
main_image_url
构建方式
ECG-QA数据集的构建方式独具匠心,首先从MIMIC-IV-ECG和PTB-XL两个大型心电图数据库中抽取样本,并通过机器生成的语句进行初步标注。随后,研究团队根据SCP-ECG v3.0标准对这些语句进行手动校正,确保数据的质量和临床相关性。此外,数据集还包含70个问题模板,涵盖了广泛的临床心电图主题,这些问题均由心电图专家验证,以确保其临床实用性。通过这种方式,ECG-QA不仅提供了丰富的单个心电图问题,还包含了需要比较分析的复杂问题,从而为智能问答系统的开发提供了坚实的基础。
特点
ECG-QA数据集的显著特点在于其多样性和临床相关性。首先,数据集包含了从MIMIC-IV-ECG和PTB-XL两个不同来源的心电图数据,确保了数据的广泛覆盖。其次,数据集中的问题模板经过精心设计,涵盖了从简单验证到复杂比较分析的多种类型,满足了不同层次的临床需求。此外,数据集还提供了经过专家验证的答案,确保了数据的准确性和可靠性。最后,数据集的结构化设计使得用户可以轻松地进行数据处理和模型训练,为心电图分析领域的研究提供了极大的便利。
使用方法
ECG-QA数据集的使用方法简便而灵活。用户可以通过提供的Python代码示例轻松加载和处理数据,数据集的结构化设计使得用户可以快速定位和提取所需信息。为了进一步简化使用流程,数据集还提供了映射脚本,帮助用户将问答样本与相应的心电图数据进行关联。此外,数据集的GitHub页面提供了详细的实验代码和配置指南,用户可以根据需要选择不同的模型进行训练和评估。无论是进行基础的问答实验,还是进行复杂的分类任务,ECG-QA都为用户提供了全面的工具和支持。
背景与挑战
背景概述
随着自然语言处理技术在医疗领域的快速发展,医疗问答系统(QA)受到了广泛关注。然而,现有的医疗QA数据集主要集中在医学影像、临床笔记或结构化电子健康记录上,而心电图(ECG)数据与这些系统的结合潜力尚未得到充分挖掘。为了填补这一空白,ECG-QA数据集应运而生,这是首个专门为ECG分析设计的QA数据集。该数据集由70个问题模板组成,涵盖了广泛的临床相关ECG主题,每个模板均由ECG专家验证,以确保其临床实用性。ECG-QA的创建旨在为开发能够辅助临床医生进行ECG解读的智能QA系统提供宝贵的资源。
当前挑战
ECG-QA数据集的构建面临多项挑战。首先,如何将ECG数据与自然语言处理技术有效结合,以生成具有临床实用性的问答样本,是一个复杂的问题。其次,数据集的扩展版本基于MIMIC-IV-ECG数据集,其中机器生成的语句未经过类似PTB-XL数据集的专家验证,可能导致属性标签与真实标签之间的不一致。此外,数据集中包含的噪声属性仅限于‘基线漂移’,而缺乏其他类型的噪声信息,这限制了某些问题模板的适用性。最后,数据集的构建过程中,如何确保采样过程的准确性,避免错误样本的引入,也是一个重要的挑战。
常用场景
经典使用场景
ECG-QA数据集的经典使用场景主要集中在心电图(ECG)分析领域,尤其是在医疗问答系统中。该数据集通过结合心电图数据与自然语言处理技术,提供了一个全面的问答框架,能够帮助研究人员开发智能问答系统,辅助临床医生进行心电图解读。具体应用包括但不限于:通过心电图数据回答临床相关问题,比较不同心电图之间的差异,以及识别心电图中的特定病理特征。
解决学术问题
ECG-QA数据集解决了医疗问答领域中长期存在的数据集不足问题,特别是缺乏结合心电图数据的问答数据集。该数据集通过提供70个经过心电图专家验证的临床相关问题模板,填补了这一空白,为研究人员提供了丰富的资源,推动了心电图分析与自然语言处理技术的结合研究。其意义在于,通过提供高质量的标注数据,促进了智能医疗问答系统的开发,提升了临床决策支持的准确性和效率。
衍生相关工作
ECG-QA数据集的发布催生了一系列相关研究工作,特别是在心电图分析与自然语言处理的交叉领域。例如,研究人员基于该数据集开发了多种问答模型,包括基于Transformer的模型、卷积神经网络(CNN)以及结合大语言模型(LLM)的问答系统。此外,该数据集还推动了心电图分类与问答任务的结合研究,促进了医疗问答系统的性能提升。这些衍生工作不仅扩展了ECG-QA的应用场景,还为未来的医疗智能化研究提供了新的方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作