Indiana University Chest X-ray dataset

github2025-02-05 更新2025-03-08 收录

下载链接：

https://github.com/MH-mirghaderi/Design-an-automated-report-generation-model-for-medical-images

下载链接

链接失效反馈

官方服务：

资源简介：

印第安纳大学胸透X射线数据集，包含7,470张X射线图像和3,851份患者报告。每份报告中的X射线图像数量从1到5不等。训练数据包含三个关键元素：指征、印象和发现。

The Indiana University Chest Radiograph Dataset contains 7,470 X-ray images and 3,851 patient reports. The number of X-ray images in each report varies from 1 to 5. The training data comprises three key elements: indications, impressions, and findings.

创建时间：

2025-02-05

原始信息汇总

数据集概述

数据集名称

Design-an-automated-report-generation-model-for-medical-images

数据集简介

该数据集用于设计一个自动生成医疗影像报告的模型，通过采用编码器-解码器架构来解决手动解释医疗影像结果和报告生成的时间消耗问题。

数据集来源

数据集来源于Open-I收集的印第安纳大学胸部X光片数据集（Indiana University Chest X-ray dataset），来自印第安纳大学医院网络。

数据集组成

7,470张X光片图像
3,851份患者报告

图像特点

每张图像包含两个视图：正面和侧面。
每份报告包含1到5张X光片图像。

数据集结构

训练数据包含三个关键元素：指标（indication）、印象（impression）和发现（findings）。

模型架构

编码器：使用Vision Transformer (ViT) 提取医疗影像的视觉信息。
解码器：使用Generative Pre-trained Transformer 2 (GPT-2) 生成医疗报告。
实现编码器和解码器之间的交叉注意力机制，以对齐视觉特征和文本输出。

实验探索

探索使用其他视觉模型，如Swin Transformer、BEiT等，评估哪种编码器在该任务中表现最佳。

评估指标

使用BLEU分数、ROUGE-L等词重叠指标评估模型性能，并比较不同模型的性能以确定最有效的自动化医疗报告生成架构。

搜集汇总

数据集介绍

构建方式

该数据集的构建主要围绕医学影像报告自动生成任务展开，集成来自印第安纳大学医院网络的Open-I集合。数据集由7470张胸部X射线影像和3851份患者报告组成，每份报告包含1至5张影像，涵盖正位和侧位两种视角。数据集的核心构成包括指示、印象和发现三大要素，旨在支撑编码器-解码器架构的自动化报告生成模型的训练。

使用方法

使用该数据集时，研究者可利用Vision Transformer (ViT) 作为编码器提取医学影像的视觉信息，并以Generative Pre-trained Transformer 2 (GPT-2) 作为解码器生成医学报告。同时，研究者还可以通过引入交叉注意力机制，优化视觉特征与文本输出的对齐。此外，评估模型性能时，可使用BLEU分数和ROUGE-L等词重叠指标，以比较不同编码器架构在自动化医学报告生成任务中的效果。

背景与挑战

背景概述

Indiana University Chest X-ray dataset是由Indiana University Hospital网络创建的医学影像数据集，旨在推动医学影像自动化报告生成模型的研究。该数据集的构建时间为近期，主要研究人员来自于Indiana University。该数据集聚焦于解决医学影像领域中的报告生成问题，包含了7,470张X射线影像和3,851份患者报告，每份报告包含1至5张影像，分为正位和侧位两种视角。数据集的构建对医学影像分析领域产生了显著影响，为研究者提供了丰富的资源，以探索和改进自动化报告生成模型。

当前挑战

该数据集在研究领域中面临的挑战主要包括：1) 如何精确地从医学影像中提取特征，以生成准确的报告，这需要克服影像解析和特征提取的技术难题；2) 构建一个高效的多模态编码器-解码器模型，其中编码器需从影像中提取视觉信息，解码器则生成医疗报告，同时需实现编码器与解码器之间的交叉注意力机制，以对齐视觉特征与文本输出；3) 探索其他视觉模型如Swin Transformer、BEiT等在医疗影像上的应用，评估哪种编码器在此任务中表现最佳；4) 使用BLEU分数、ROUGE-L等单词重叠指标评估模型性能，并比较不同架构模型的效能，以确定自动化医疗报告生成的最有效架构。

常用场景

经典使用场景

在医学影像分析领域，Indiana University Chest X-ray dataset 被广泛用于构建自动化的医学报告生成模型。该数据集包含7,470张X射线图像及其对应的3,851份患者报告，为研究者提供了一个综合性的资源，以便开发能够自动解读影像并生成报告的算法。

解决学术问题

该数据集解决了医学影像分析中报告生成效率低下的问题，有助于减少诊断过程中的时间延误。通过使用该数据集，研究者能够设计并训练编码器-解码器架构的模型，从而自动从X射线图像中提取关键信息，并据此生成结构化的医疗报告。

实际应用

在实际应用中，基于该数据集开发的模型能够辅助医生快速准确地生成诊断报告，提升医疗服务效率，降低误诊率。此外，该模型在处理大量影像数据时，可以显著减少人工阅读和记录的时间。

数据集最近研究