MURA
收藏arXiv2025-09-30 收录
下载链接:
https://stanfordmlgroup.github.io/competitions/mura/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为MURA,是一个包含骨骼X光图像的大型肌肉骨骼放射影像数据集。其中,针对膝关节疲劳分级的目标数据集包含了从合作医院收集的2,725张X光图像。整个数据集规模超过40,000张图像,任务是对膝关节进行疲劳分级。
This dataset, designated as MURA, is a large-scale musculoskeletal radiography dataset encompassing skeletal X-ray images. The targeted subset dedicated to knee joint fatigue grading includes 2,725 X-ray images collected from cooperating hospitals. The full dataset consists of more than 40,000 images, and its core task is to perform fatigue grading on knee joints.
提供机构:
Stanford ML Group
搜集汇总
数据集介绍

构建方式
MURA数据集由斯坦福大学研究团队构建,旨在推动肌肉骨骼X光影像异常检测的深度学习研究。数据源自斯坦福医院PACS系统,经机构审查委员会批准,收集了2001年至2012年间去标识化的HIPAA合规影像,涵盖12,173名患者的14,863项研究,共计40,561张多视角X光图像。每项研究由放射科医师在临床解读时手动标注为正常或异常,分为肘部、手指、前臂、手部、肱骨、肩部和腕部七种上肢研究类型。数据集按患者无重叠原则划分为训练集(11,184名患者,13,457项研究)、验证集(783名患者,1,199项研究)和测试集(206名患者,207项研究)。为稳健评估模型性能,测试集额外获取了六位放射科医师的独立标注,并以其中三位的多数投票作为金标准。
特点
MURA是当前公开最大的肌肉骨骼X光影像数据集之一,其核心特点在于规模庞大且标注可靠。数据集包含9,045项正常研究和5,818项异常研究,异常类型涵盖骨折、植入物、退行性关节病变及病变和半脱位等。每项研究由多位放射科医师在临床环境中标注,测试集更引入六位医师的独立评审,确保标签质量。影像来源于高分辨率PACS显示器,分辨率与宽高比各异,真实反映临床多样性。此外,数据集支持弱监督异常定位,通过类激活映射可视化模型关注的区域,为可解释性研究提供基础。
使用方法
MURA适用于训练和评估上肢X光异常检测模型,任务为二分类:输入一项研究的多视角图像,输出正常或异常概率。典型方法采用169层DenseNet架构,每张图像经预处理(归一化至ImageNet均值标准差、缩放至320×320)后输入网络,预测异常概率,再对各视角概率取算术平均作为研究级输出。训练时使用加权二元交叉熵损失以平衡类别,并应用随机水平翻转和旋转(±30°)进行数据增强。模型从ImageNet预训练权重初始化,使用Adam优化器(初始学习率0.0001,按验证损失衰减),集成验证损失最低的五个模型。评估指标包括AUROC、敏感度、特异度及与放射科医师的Cohen's kappa一致性。数据集已公开于斯坦福机器学习组网站,供学术研究免费使用。
背景与挑战
背景概述
肌骨系统疾病是全球范围内导致长期疼痛与残疾的首要原因,每年影响超过17亿人口,并占据急诊就诊量的显著比例。在此背景下,斯坦福大学计算机科学系与放射学系的研究人员于2018年联合发布了MURA数据集,旨在推动肌骨X光片异常检测的深度学习研究。该数据集由Pranav Rajpurkar、Jeremy Irvin等人主导构建,包含来自12,173名患者的14,863项上肢肌骨影像研究,涵盖肩、肱骨、肘、前臂、腕、手及手指七种标准检查类型,共计40,561张多视角X光图像。每项研究均由经委员会认证的放射科医生在临床环境中手动标注为正常或异常,测试集更额外汇集六位放射科专家的独立标注以确立金标准。MURA的发布填补了公开肌骨影像数据集规模有限的空白,成为该领域最具影响力的基准之一,为算法开发与临床转化提供了关键数据支撑。
当前挑战
MURA数据集所面临的挑战多维且深刻。在领域问题层面,肌骨X光片异常检测的核心难点在于病变类型的多样性——包括骨折、植入物、退行性关节病变及脱位等,且不同解剖部位(如肘、肱骨、肩)的异常表现差异显著,导致模型在部分部位(如手指、腕部)表现接近顶尖放射科医生,但在肘、前臂、肱骨等部位显著落后于人类专家,凸显了模型泛化能力的不足。在构建过程中,挑战同样严峻:数据源自2001至2012年斯坦福医院PACS系统的去标识化影像,不同时期、不同设备的图像分辨率与长宽比参差不齐;标注依赖放射科医生在临床工作中的原始解读,虽保证了专业性,但回顾性标注的测试集仍需额外六位专家独立复核以降低主观偏差;此外,正常与异常样本分布不均(9,045例正常对5,818例异常),且部分病变类型(如硬化性病变)在数据中占比稀少,进一步加剧了模型学习的难度。
常用场景
经典使用场景
在医学影像分析领域,MURA数据集作为大规模上肢骨骼X光片异常检测的基准资源,被广泛用于训练和评估深度学习模型在骨骼放射学中的分类能力。研究者利用该数据集构建二分类模型,以判别单次检查(包含一张或多张视图)是否呈现异常,涵盖肩部、肱骨、肘部、前臂、手腕、手部及手指等七种标准检查类型。该场景的核心在于模拟放射科医师在临床工作中的关键任务——区分正常与异常检查,从而为自动化辅助诊断系统提供可靠的验证平台。
实际应用
在实际临床场景中,MURA数据集驱动的异常检测模型可被部署于工作列表优先级排序系统,将疑似异常的检查提前至放射科医师的阅片队列,从而加速危重患者的诊断与治疗。此外,模型对正常检查的自动识别可生成初步“正常”报告,优化医疗资源分配,减少不必要的前置检查,并提升急诊等场景下的患者流转效率。该数据集还支持异常定位功能(如类激活映射),能够高亮影像中的可疑区域,辅助缓解放射科医师因长时间阅片导致的视觉疲劳,降低漏诊风险,有望在医疗资源匮乏地区发挥重要的辅助诊断作用。
衍生相关工作
MURA数据集的发布催生了一系列经典后续工作,包括基于注意力机制的改进模型、多视图融合策略以及对比学习框架,以提升对复杂异常(如肘部、肱骨和肩部)的检测精度。研究者还探索了弱监督定位技术与可解释性方法,利用类激活映射等工具实现对异常区域的视觉化。此外,该数据集被用于跨领域迁移学习研究,验证了预训练于自然图像(如ImageNet)的深度网络在医学影像上的适应性。这些工作不仅深化了对骨骼X光片自动分析的认知,也为后续构建更全面的多部位、多疾病医学影像基准数据集提供了方法论参考。
以上内容由遇见数据集搜集并总结生成



