Tufts Medical Echocardiogram Dataset (TMED)

Name: Tufts Medical Echocardiogram Dataset (TMED)
Creator: 塔夫茨大学
Published: 2021-07-31 05:08:12
License: 暂无描述

arXiv2021-07-31 更新2024-06-21 收录

下载链接：

https://TMED.cs.tufts.edu

下载链接

链接失效反馈

官方服务：

资源简介：

Tufts Medical Echocardiogram Dataset (TMED)是由塔夫茨大学开发的一个开放访问数据集，旨在评估半监督学习在心脏超声（echocardiogram）解释中的应用，特别是视图分类和疾病严重程度分类。该数据集包含2905个心脏研究，其中260个研究具有由临床专家提供的视图和诊断标签，而其余2471个研究则是真正的无标签数据。TMED数据集的设计考虑到了半监督学习的真实潜力，因为它不仅包含标记集，还包含大量在标准心脏护理过程中捕获的无标签集。该数据集的应用领域是改善心脏疾病的及时诊断和治疗，尤其是主动脉瓣狭窄（AS），这是一个常见的心脏瓣膜状况。通过自动化初步评估AS，可以提高疾病检测的准确性和可重复性，减少访问障碍，特别是在没有专家心脏病专家的地理区域。

Tufts Medical Echocardiogram Dataset (TMED) is an open-access dataset developed by Tufts University, aiming to evaluate the application of semi-supervised learning in echocardiogram interpretation, specifically for view classification and disease severity classification. This dataset comprises 2905 cardiac studies, of which 260 studies are annotated with view and diagnostic labels by clinical experts, while the remaining 2471 studies are genuine unlabeled data. The TMED dataset is designed to showcase the real-world potential of semi-supervised learning, as it incorporates not only a labeled subset but also a large volume of unlabeled data captured during standard cardiac care workflows. The dataset is intended to improve timely diagnosis and treatment of cardiovascular diseases, particularly aortic stenosis (AS), a common cardiac valve condition. By automating the preliminary assessment of AS, the accuracy and reproducibility of disease detection can be enhanced, while reducing access barriers to care, especially in geographic regions where specialist cardiologists are scarce.

提供机构：

塔夫茨大学

创建时间：

2021-07-31

搜集汇总

数据集介绍

构建方式

Tufts Medical Echocardiogram Dataset (TMED) 是一个专门用于评估半监督学习方法在心脏超声图像（超声心动图）解读中的两个相关任务：视图分类和疾病严重程度分类的基准数据集。该数据集包含了由专家临床医生提供的标签，包括260名患者的疾病严重程度标签和所有图像的视图标签。此外，数据集还包含了来自2645名患者的未标记图像，这些图像是在标准心脏护理过程中捕获的，旨在评估半监督学习的真实潜力。

特点

TMED数据集的特点在于它不仅包含了一个小型的标记数据集，还包含了一个大型的未标记数据集，这使得它成为评估半监督学习方法真实潜力的理想选择。数据集中的图像是从波士顿Tufts医疗中心过去五年中的记录中提取的，这些记录遵循美国超声心动图学会（ASE）指南。数据集中的每个研究都包含多个心脏视频片段，展示了不同的解剖视图。数据集的设计旨在克服当前心脏超声图像分类中存在的两个主要挑战：缺乏大量标记数据和患者记录中包含的数百张图像中许多与诊断无关的图像。

使用方法

使用TMED数据集时，研究者可以将其分为两部分：标记数据集和未标记数据集。标记数据集包含260名患者的图像和标签，可用于训练和评估监督学习模型。未标记数据集包含2645名患者的图像，可用于训练半监督学习模型。数据集还包含了两个版本：全尺寸版本（TMED-156-52）和小尺寸版本（TMED-18-18），以适应不同的研究需求。使用数据集时，研究者应遵循数据集中的标签和视图信息，以及相关的评估框架，以确保准确性和一致性。

背景与挑战

背景概述

TMED数据集的创建旨在解决临床医学中主动脉瓣狭窄(AS)的及时诊断问题。主动脉瓣狭窄是一种常见的瓣膜性疾病，如不及时治疗，其5年生存率低于某些转移性癌症。当前实践中，多达2/3的有症状的AS患者可能从未接受过治疗。因此，迫切需要提高这种危及生命的状况的及时检测。TMED数据集由Tufts大学计算机科学系的Zhe Huang、Gary Long、Benjamin Wessler和Michael C.Hughes于2021年创建，旨在评估半监督学习方法在两个与心脏超声(超声心动图)解释相关的任务中的表现：视图分类和疾病严重程度分类。该数据集包含了大量未经标记的图像，以及一个费用高昂收集的标记数据集，以实现比仅使用标记数据集更好的性能。此外，数据集还进一步追求患者水平的诊断预测，这需要汇总数百张不同视图类型的图像，其中大多数与预测无关，以做出连贯的预测。最佳的患者水平性能是通过优先考虑来自预测为临床相关视图的图像的诊断预测，并将视图任务的知识转移到诊断任务中实现的新方法。

当前挑战

TMED数据集面临的挑战包括：1)缺乏标记数据；2)从数百张不同视图类型的图像中汇总信息以做出患者水平的诊断预测。为了解决这些挑战，研究人员采用了半监督学习方法，如MixMatch，该方法的性能在保留集上的准确性方面取得了有希望的进展。此外，他们还开发了优先考虑来自预测为临床相关视图的图像的诊断预测的新方法，并使用预训练的视图分类器来预热诊断分类器，以进一步提高性能。这些方法有望实现主动脉瓣狭窄的自动化初步诊断。

常用场景

经典使用场景

在心脏超声心动图图像的解读中，TMED数据集被广泛用于视图分类和疾病严重程度分类。视图分类任务旨在识别超声心动图图像中的视图类型，如胸骨旁长轴视图（PLAX）和胸骨旁短轴视图（PSAX）。疾病严重程度分类任务旨在根据超声心动图图像评估主动脉瓣狭窄（AS）的严重程度，分为“无AS”、“轻度/中度AS”和“重度AS”。

实际应用

TMED数据集的实际应用场景包括自动化初步评估主动脉瓣狭窄的严重程度，从而提高诊断的准确性和可重复性。该数据集还可以帮助减少获得专家诊断的障碍，尤其是在缺乏心脏病专家的地区。此外，TMED数据集还可以用于开发其他心血管疾病的自动诊断工具，如心脏瓣膜疾病和心肌病。

衍生相关工作

TMED数据集的发布促进了半监督学习方法在医疗影像分析中的应用。该数据集的发布也激励了研究人员探索更有效的方法来利用未标记数据，并开发更先进的图像聚合技术。此外，TMED数据集还促进了多任务学习的应用，例如同时进行视图分类和疾病严重程度分类。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集