MedMNIST 和 MedOOD
收藏arXiv2025-02-17 更新2025-02-19 收录
下载链接:
https://github.com/dlotfi/MedOODFlow
下载链接
链接失效反馈官方服务:
资源简介:
MedMNIST是一个多样化的标准医学成像数据集,包含多种成像模态和任务,用于机器学习研究。MedOOD是作者团队新构建的基准数据集,包含各种临床相关的分布转移,用于评估模型在多样化和具有挑战性的条件下的泛化能力。MedOOD数据集涵盖了转换、人口、模态、诊断和器官变化等多个方面的分布转移。
MedMNIST is a diverse standard medical imaging dataset encompassing multiple imaging modalities and tasks, dedicated to machine learning research. MedOOD is a newly constructed benchmark dataset developed by the authors' team, which includes various clinically relevant distribution shifts for evaluating the generalization capability of models under diverse and challenging conditions. The MedOOD dataset covers distribution shifts across multiple dimensions, including transformation, demographic, modality, diagnostic, and organ variations.
提供机构:
香港大学李嘉诚医学院诊断放射学系
创建时间:
2025-02-17
原始信息汇总
MedOODFlow 数据集概述
数据集简介
MedOODFlow是一个基于正常化流(normalizing flows)的医学图像异常检测方法,旨在提高医学成像系统的可靠性。该方法可以在不改变预训练模型权重的情况下进行后处理集成。研究首先在MedMNIST基准数据集上评估了该方法的有效性,并引入了一个新的OOD(Out-of-Distribution)基准数据集,用于进一步验证方法。
数据集构成
- MedMNIST数据集:28x28像素的医学图像数据集,用于初步评估方法的有效性。
- MedOOD数据集:一个专门为医学图像异常检测基准设计的集合,包括来自多种成像模态和临床相关分布偏移的数据集。
数据集获取
- MedMNIST数据集:通过
medmnist包安装后,使用脚本下载。 - MedOOD数据集:准备说明见
medood/README.md文件。
相关资源
- OpenOOD:MedOODFlow项目基于OpenOOD构建。
- 预训练模型:ResNet18在OrganAMNIST上的预训练模型可以从这里下载。
使用说明
- 安装:创建Python 3.10+环境,安装所需包。
- 训练和评估脚本:位于
scripts/ood/nflow文件夹中。 - 训练3D-ResNet18:使用
scripts/basics/brats20_t1/train_brats20_t1.sh脚本。
引用
@article{lotfi2025medoodflow, title={Enhancing Out-of-Distribution Detection in Medical Imaging with Normalizing Flows}, author={Dariush Lotfi and Mohammad-Ali Nikouei Mahani and Mohamad Koohi-Moghadam and Kyongtae Ty Bae}, journal={arXiv preprint arXiv:2502.11638}, year={2025} }
搜集汇总
数据集介绍

构建方式
MedMNIST 和 MedOOD 数据集的构建方式涉及对医疗影像中的分布偏移进行模拟,以便评估模型对未知数据的检测能力。MedMNIST 是一个多样化的标准化医疗影像数据集,用于机器学习研究,涵盖了 X 射线、CT 扫描、皮肤镜检查、显微镜检查、眼底摄影和病理学等多种影像模态。MedOOD 数据集则是一个新构建的 OOD 基准数据集,模拟了临床相关的分布偏移,包括变换、模态、诊断、人群和器官等方面的变化。
使用方法
MedMNIST 和 MedOOD 数据集的使用方法包括使用预训练模型提取特征,并利用正则化流方法对特征向量进行概率密度估计。这种后处理方法允许模型无缝地集成到预训练模型中,无需修改模型权重或重新训练。研究者可以使用这些数据集来评估和比较不同 OOD 检测方法的性能,并进一步改进模型的泛化能力。
背景与挑战
背景概述
MedMNIST和MedOOD数据集是在香港大学李嘉诚医学院诊断放射学系的领导下创建的,旨在解决医学影像中异常检测的问题。这些数据集的创建时间是2023年,由Dariush Lotfi、Mohammad-Ali Nikouei Mahani、Mohamad Koohi-Moghadam和Kyongtae Ty Bae等研究人员共同完成。该数据集的主要研究问题是医学影像中的异常检测,即如何准确识别出与模型训练分布不同的输入数据,以保证临床工作流程的可靠性和安全性。MedMNIST和MedOOD数据集对医学影像领域的研究产生了深远的影响,为医学影像中的异常检测提供了新的研究思路和方法。
当前挑战
MedMNIST和MedOOD数据集面临的挑战主要包括:1)异常检测的挑战:现有的异常检测方法通常需要修改预训练模型或重新训练,这在临床环境中并不实用。2)构建过程中所遇到的挑战:构建MedMNIST和MedOOD数据集需要收集大量的医学影像数据,并进行标准化处理,以保证数据的可靠性和准确性。此外,还需要考虑数据集的多样性和代表性,以适应不同的临床应用场景。
常用场景
经典使用场景
MedMNIST 和 MedOOD 数据集被广泛应用于医疗影像领域的异常检测。这些数据集提供了多样化的医疗影像数据,包括正常和异常的医学图像,用于训练和评估异常检测模型。MedMNIST 数据集包含了多种医学影像模式,如 X 射线、CT 扫描、皮肤镜检查、显微镜检查、眼底摄影和病理切片等。MedOOD 数据集则专注于模拟临床相关的分布偏移,包括变换、模式、诊断、人口和器官等方面的变化。这些数据集为研究人员提供了丰富的数据资源,有助于开发更准确、更可靠的医疗影像异常检测模型。
解决学术问题
MedMNIST 和 MedOOD 数据集解决了医疗影像领域中异常检测的学术研究问题。传统的异常检测方法往往需要修改预训练模型或重新训练,这在临床环境中不切实际。MedMNIST 和 MedOOD 数据集通过提供多样化的医疗影像数据,使得研究人员可以训练出更准确的异常检测模型,从而提高医疗影像诊断的准确性和可靠性。此外,这些数据集还可以用于评估和比较不同异常检测方法的性能,推动该领域的研究进展。
实际应用
MedMNIST 和 MedOOD 数据集在实际应用场景中具有广泛的应用价值。这些数据集可以用于开发医疗影像异常检测系统,帮助医生快速识别出异常图像,从而提高诊断的准确性和效率。此外,这些数据集还可以用于训练和评估医疗影像分割模型,帮助医生更准确地分割出病变区域,为治疗提供更精确的依据。此外,这些数据集还可以用于开发医疗影像分类模型,帮助医生快速对医学图像进行分类,提高诊断的效率。总之,MedMNIST 和 MedOOD 数据集在实际应用场景中具有广泛的应用价值,为医疗影像领域的研究和应用提供了重要的数据资源。
数据集最近研究
最新研究方向
MedMNIST 和 MedOOD 数据集的最新研究方向在于利用正则化流进行医学影像的分布外检测。正则化流是一种概率生成模型,能够精确地计算数据的似然性,并有效地进行采样。与传统的基于像素空间密度估计的方法不同,正则化流在特征空间中操作,专注于捕捉语义上有意义的表示,避免了依赖像素级统计。该研究提出了一种基于正则化流的分布外检测方法,该方法无需修改预训练模型即可无缝集成。该方法在 MedMNIST 和 MedOOD 数据集上进行了评估,结果表明,该方法在分布外检测方面表现出色,同时保持了高识别率。
相关研究论文
- 1Enhancing Out-of-Distribution Detection in Medical Imaging with Normalizing Flows香港大学李嘉诚医学院诊断放射学系 · 2025年
以上内容由遇见数据集搜集并总结生成



