Confident Pseudo-labeled Diffusion Augmentation for Canine Cardiomegaly Detection

Name: Confident Pseudo-labeled Diffusion Augmentation for Canine Cardiomegaly Detection
Creator: 叶史瓦大学卡茨科学与健康学院
Published: 2025-01-14 02:10:19
License: 暂无描述

arXiv2025-01-14 更新2025-01-15 收录

下载链接：

https://github.com/Shira7z/CDA

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由叶史瓦大学的研究团队创建，旨在通过合成数据增强和伪标签技术解决犬类心脏肥大检测中的训练数据不足问题。数据集包含3000张合成的犬类胸部X光图像，每张图像均手动标注了脊椎心脏评分（VHS）。数据生成过程利用先进的扩散模型生成高质量的合成图像，并通过伪标签策略进一步优化数据集。该数据集的应用领域为兽医诊断，特别是犬类心脏肥大的自动化检测，旨在提高诊断的准确性和效率，减少人工标注的工作量。

This dataset was developed by a research team at Yeshiva University to address the shortage of training data for canine cardiac hypertrophy detection using synthetic data augmentation and pseudo-labeling techniques. It comprises 3,000 synthetic canine chest X-ray images, each manually annotated with the Vertebral Heart Score (VHS). The data generation pipeline utilizes state-of-the-art diffusion models to generate high-quality synthetic images, and further optimizes the dataset via pseudo-labeling strategies. Targeted at veterinary diagnostic applications, particularly automated detection of canine cardiac hypertrophy, this dataset aims to enhance diagnostic accuracy and efficiency while reducing the burden of manual annotation work.

提供机构：

叶史瓦大学卡茨科学与健康学院

创建时间：

2025-01-14

搜集汇总

数据集介绍

构建方式

该数据集的构建基于犬类胸部X光片，原始数据来自上海爱宠宠物医院的DogHeart数据集，包含6,389张图像。为了增强数据多样性并提升模型的泛化能力，研究团队通过先进的扩散模型生成了3,000张合成X光片，并手动标注了每张图像的脊椎心脏评分（VHS）。最终数据集包含5,000张图像，其中4,400张用于训练，200张用于验证，400张用于测试。所有图像均经过预处理，裁剪至胸部区域，并移除了任何可能泄露隐私的信息。

特点

该数据集的特点在于其结合了真实与合成的犬类胸部X光片，涵盖了从正常到严重心脏肥大的多种情况。每张图像均经过精确的VHS标注，分为三类：小心脏（VHS < 8.2）、正常心脏（8.2 ≤ VHS ≤ 10）和大心脏（VHS > 10）。此外，数据集通过扩散模型生成的合成图像引入了多样化的解剖结构和成像条件，增强了模型对真实世界复杂场景的适应能力。这种数据增强策略有效解决了医学影像数据稀缺和类别不平衡的问题。

使用方法

该数据集主要用于训练和评估犬类心脏肥大的自动检测模型。研究人员使用EfficientNet-B7作为基础模型架构，并通过蒙特卡洛Dropout进行伪标签生成，以利用未标注数据提升模型性能。训练过程中，模型通过迭代的方式结合高置信度的伪标签和合成数据，逐步优化其预测能力。最终模型能够根据X光片自动计算VHS，并将心脏大小分类为正常、临界或严重肥大。该数据集的使用不仅提升了模型的准确性，还为兽医诊断提供了高效、可靠的辅助工具。

背景与挑战

背景概述

犬类心脏肥大（Canine Cardiomegaly）是一种常见的心脏疾病，若不及时诊断，可能对犬类健康造成严重威胁。传统的诊断方法依赖于兽医的主观判断，如脊椎心脏评分（Vertebral Heart Score, VHS），但其准确性和一致性受到限制。近年来，人工智能（AI）和深度学习（DL）技术在医学影像领域展现出巨大潜力，尤其是在图像分类和模式识别方面。然而，兽医领域的AI应用仍面临诸多挑战，尤其是在数据稀缺和标注质量不高的情况下。为此，Yeshiva大学的Shiman Zhang等人提出了基于扩散模型和伪标签技术的犬类心脏肥大检测模型（Confident Pseudo-labeled Diffusion Augmentation, CDA），旨在通过生成合成X射线图像和高质量伪标签，提升模型的泛化能力和诊断精度。该研究不仅推动了兽医影像诊断的自动化进程，还为解决数据稀缺问题提供了创新思路。

当前挑战

犬类心脏肥大检测面临的主要挑战包括数据稀缺和标注质量不高。首先，现有的犬类心脏影像数据集规模较小，且标注质量参差不齐，导致模型难以在不同成像条件下泛化。其次，传统的VHS评分依赖于人工测量，存在主观性和误差，进一步限制了模型的训练效果。在构建CDA数据集的过程中，研究人员通过扩散模型生成合成X射线图像，并结合伪标签技术扩展数据集。然而，合成数据的质量控制和伪标签的置信度筛选是构建过程中的关键挑战。此外，模型的训练过程需要大量计算资源，尤其是在使用蒙特卡洛Dropout进行不确定性估计时，计算复杂度显著增加。这些挑战不仅影响了模型的训练效率，也对实际应用中的可扩展性提出了更高要求。

常用场景

经典使用场景

该数据集主要用于犬类心脏肥大（Cardiomegaly）的自动检测与诊断。通过结合扩散模型生成合成X射线图像，并使用伪标签技术对未标注数据进行高置信度标注，该数据集显著提升了深度学习模型在犬类心脏肥大检测中的泛化能力和准确性。经典使用场景包括在兽医放射学中，利用该数据集训练模型以自动计算椎体心脏评分（VHS），从而辅助兽医快速、准确地诊断犬类心脏疾病。

解决学术问题

该数据集解决了兽医医学领域中高质量标注数据稀缺的问题。通过扩散模型生成合成X射线图像，并结合伪标签技术，有效扩展了训练数据的多样性和规模，提升了模型在复杂成像条件下的泛化能力。此外，该数据集还解决了传统椎体心脏评分（VHS）方法中因人工测量误差导致的诊断不一致性问题，为自动化、标准化的犬类心脏肥大检测提供了可靠的技术支持。

衍生相关工作

该数据集衍生了一系列相关研究工作，主要集中在深度学习与兽医医学的结合领域。例如，基于该数据集的伪标签技术，研究人员进一步开发了不确定性估计方法，以优化伪标签的选择过程。此外，扩散模型在生成高质量合成图像方面的成功应用，也推动了其他兽医医学图像生成任务的发展，如犬类髋关节角度的估计。这些衍生工作不仅扩展了该数据集的应用范围，还为兽医医学中的其他自动化诊断任务提供了新的技术路径。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集