five

BMAD

收藏
arXiv2024-04-28 更新2024-06-21 收录
下载链接:
https://github.com/DorisBao/BMAD
下载链接
链接失效反馈
官方服务:
资源简介:
BMAD数据集是由阿尔伯塔大学和卡内基梅隆大学的研究团队开发的,旨在为医学图像异常检测提供一个全面的评估基准。该数据集包含六个来自五个不同医学领域的重新组织的数据集,包括脑部MRI、肝脏CT、视网膜OCT、胸部X光和数字病理学。这些数据集用于评估和比较不同的异常检测算法,特别是在无监督学习环境下的性能。BMAD数据集的设计考虑了医学图像的多样性和复杂性,旨在推动更通用和鲁棒的异常检测方法的发展。

The BMAD dataset was developed by research teams from the University of Alberta and Carnegie Mellon University, aiming to provide a comprehensive evaluation benchmark for medical image anomaly detection. This dataset comprises six reorganized datasets spanning five distinct medical domains, including brain MRI, liver CT, retinal OCT, chest X-ray, and digital pathology. These datasets are utilized to evaluate and compare the performance of various anomaly detection algorithms, especially under unsupervised learning scenarios. The BMAD dataset was designed with full consideration of the diversity and complexity of medical images, with the goal of promoting the development of more generalizable and robust anomaly detection methods.
提供机构:
阿尔伯塔大学和卡内基梅隆大学
创建时间:
2023-06-21
搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像异常检测领域,构建标准化评估基准面临数据来源分散与重组方法不一的挑战。BMAD基准通过系统化重组现有医学影像数据集,整合了来自五个关键医学领域的六个子数据集,涵盖脑部MRI、肝脏CT、视网膜OCT、胸部X射线及数字病理学。具体构建过程中,研究团队依据无监督异常检测的任务需求,对原始数据进行深度清洗与重构:例如从BraTS2021数据集中沿轴向切片筛选含脑实质的二维图像,并依据患者ID严格划分训练集与测试集以避免数据泄露;在肝脏CT基准中,融合BTCV与LiTS数据集,通过霍恩斯菲尔德单位转换、肝脏区域裁剪及直方图均衡化等处理流程,构建出兼具像素级与样本级评估能力的标准化数据。所有数据均遵循原始许可协议,并经过严格的伦理与合规性审核,确保了基准的科学性与可复现性。
特点
BMAD基准的突出特点在于其多维度的医学影像覆盖与精细化的评估体系。该基准囊括了五种模态的医学影像,不仅涵盖了结构性异常(如脑肿瘤、肝脏病变),还包含功能性异常(如视网膜水肿)与组织学异常(如乳腺癌转移),从而全面反映了临床实践中异常表现的多样性。在评估维度上,基准创新性地融合了样本级异常检测与像素级异常定位的双重任务,并引入了图像级AUROC、像素级AUROC及区域重叠度(PRO)三项核心指标,其中PRO指标通过平等加权不同尺寸的异常区域,有效缓解了传统AUROC对小尺寸病变定位不敏感的问题。此外,基准集成了十五种前沿异常检测算法,涵盖重建型与特征嵌入型两大范式,为方法比较提供了统一框架。
使用方法
研究者可通过BMAD提供的结构化代码库系统性地评估异常检测算法。使用流程始于数据准备阶段,代码库支持自动下载与重组原始数据集,并生成符合无监督异常检测格式的训练集、验证集与测试集。在算法评估环节,用户可选择集成于基准中的十五种算法(如PatchCore、RD4AD、DRAEM等),或通过标准化接口导入自定义模型。训练过程中,代码库支持超参数调优与多轮随机种子实验,以确保结果的稳定性;评估阶段则自动计算图像级AUROC、像素级AUROC及PRO指标,并生成异常定位的可视化热图。对于高级用户,基准还提供了扩展接口,允许在新增医学影像数据上构建定制化评估任务,从而推动领域内算法的迭代与创新。
背景与挑战
背景概述
在医学影像分析领域,异常检测作为一项关键技术,对于识别罕见疾病或异常病变具有重要临床价值。然而,长期以来,该领域缺乏统一且公平的评估基准,阻碍了通用且鲁棒的异常检测方法的发展。为此,阿尔伯塔大学与卡内基梅隆大学的研究团队于2024年提出了BMAD基准数据集,旨在填补这一空白。该数据集整合了来自脑部MRI、肝脏CT、视网膜OCT、胸部X射线和数字病理学五个医学领域的六个重组数据集,涵盖了十五种前沿异常检测算法与三项核心评估指标。BMAD的创建不仅为标准化的方法比较提供了平台,还通过精心设计的代码库促进了医学异常检测技术的系统评估与进步。
当前挑战
BMAD数据集面临的挑战主要体现在两个方面:在领域问题层面,医学异常检测需应对异常样本的异构性与罕见性,这导致传统监督学习方法在未见异常上表现不佳,而生成模型在像素级重建中可能过度泛化,难以准确捕捉高层次语义异常;在构建过程中,数据重组面临显著困难,包括原始数据来源引用不一致、数据集重组方式缺乏共识,以及医学影像中正常与异常样本分布不平衡带来的评估偏差。此外,数据主要来自发达国家,存在固有的地理与采样偏差,可能影响模型的泛化能力。
常用场景
经典使用场景
在医学影像分析领域,BMAD数据集为无监督异常检测算法的评估提供了标准化平台。该数据集整合了脑部MRI、肝脏CT、视网膜OCT、胸部X光及数字病理学五大医学影像领域的六个重组数据集,覆盖了从像素级定位到样本级检测的多层次评估需求。研究者通过BMAD内置的十五种前沿算法与三项核心评估指标,能够系统性地验证模型在跨模态医学影像中的泛化能力与鲁棒性,尤其适用于探索罕见病变的检测机制。
实际应用
BMAD在临床辅助诊断与医学影像质控中展现出重要价值。其支持的算法可应用于早期肿瘤筛查、罕见病变预警及影像质量异常检测等场景,例如通过视网膜OCT数据识别糖尿病性黄斑水肿,或利用肝脏CT数据定位微小肿瘤病灶。数据集涵盖的多样化医学影像模态与病理类型,为开发适应实际医疗环境的自适应异常检测系统提供了数据基础,有助于降低漏诊率并提升诊断效率。
衍生相关工作
基于BMAD的评估框架,多项经典工作得以深入拓展。知识蒸馏范式下的RD4AD与MKD算法通过师生网络结构实现了异常区域的精细化定位;记忆库机制驱动的PatchCore与CFA方法在样本级检测中表现出色;而基于归一化流的CFlow与CS-Flow则探索了概率建模在医学异常检测中的潜力。这些研究不仅验证了预训练模型在医学领域的迁移价值,更揭示了多尺度特征融合与对抗性训练在提升模型鲁棒性方面的关键作用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作