MURA
收藏arXiv2018-05-22 更新2024-06-21 收录
下载链接:
http://stanfordmlgroup.github.io/competitions/mura
下载链接
链接失效反馈官方服务:
资源简介:
MURA是由斯坦福大学创建的大型数据集,专注于上肢的肌肉骨骼放射图像,包含14,863项研究共计40,561张图像。每项研究均由放射科医生手动标记为正常或异常。数据集的创建过程涉及从斯坦福医院PACS系统收集去标识化、符合HIPAA标准的图像,并由放射科医生在临床放射学环境中进行标记。MURA数据集的应用领域主要在于通过深度学习模型检测肌肉骨骼异常,旨在提高放射学诊断的准确性和效率,特别是在全球超过17亿人受影响的肌肉骨骼疾病领域。
MURA is a large-scale dataset developed by Stanford University, focusing on musculoskeletal radiographs of upper extremities. It consists of 40,561 images across 14,863 studies. Each study is manually annotated as either normal or abnormal by radiologists. The dataset was created by collecting de-identified, HIPAA-compliant images from the PACS system of Stanford Hospital, with labeling conducted by radiologists in a clinical radiology environment. The main application scenario of the MURA dataset is detecting musculoskeletal abnormalities using deep learning models, aiming to enhance the accuracy and efficiency of radiological diagnosis, particularly for musculoskeletal disorders that affect more than 1.7 billion people worldwide.
提供机构:
斯坦福大学
创建时间:
2017-12-12
搜集汇总
数据集介绍

构建方式
MURA数据集通过从斯坦福医院的图片存档与通信系统(PACS)中收集去识别化的、符合HIPAA标准的放射图像构建而成。该数据集包含了14,863个上肢骨骼放射学研究,总计40,561张多视角放射图像,涵盖了肩部、肱骨、肘部、前臂、腕部、手部和手指等七个标准的上肢放射学研究类型。每个研究由斯坦福医院的放射科医生在临床放射学环境中手动标注为正常或异常,标注过程基于DICOM图像,确保了数据的高质量与临床相关性。
特点
MURA数据集的一个显著特点是其规模和多样性,它包含了9,045个正常和5,818个异常的上肢骨骼放射学研究,是目前公开的最大的放射图像数据集之一。此外,数据集中的每个研究包含一个或多个视角的图像,且图像的分辨率和纵横比各异,这为模型训练提供了丰富的视觉信息。为了确保模型的鲁棒性评估,研究团队还额外收集了六位斯坦福放射科医生对测试集的标注,进一步提升了数据集的可靠性。
使用方法
MURA数据集主要用于二分类任务,即判断上肢骨骼放射学研究是否存在异常。用户可以通过输入一个或多个视角的放射图像,利用169层卷积神经网络(DenseNet)模型预测每个视角的异常概率,并通过算术平均得出整个研究的异常概率。模型的输出为二值标签,指示研究是否异常。此外,数据集还提供了详细的标注信息和测试集的额外标注,用户可以利用这些信息进行模型性能的评估与比较,尤其是在与放射科医生的诊断一致性方面。
背景与挑战
背景概述
MURA数据集由斯坦福大学的研究团队于2018年推出,旨在推动深度学习在肌肉骨骼放射影像中的异常检测研究。该数据集包含了14,863个上肢肌肉骨骼研究,总计40,561张图像,由斯坦福医院的放射科医生手动标注为正常或异常。MURA的创建不仅为深度学习模型提供了大规模的训练数据,还通过引入额外的放射科医生标注,确保了评估模型的鲁棒性和准确性。该数据集的发布对医学影像领域具有重要意义,尤其是在自动化异常检测和减少放射科医生工作负担方面,展示了巨大的应用潜力。
当前挑战
MURA数据集的主要挑战在于其复杂的分类任务,即从上肢放射影像中区分正常与异常。尽管模型在手指和手腕研究中的表现与最佳放射科医生相当,但在肘部、前臂、手、肱骨和肩部研究中的表现仍低于放射科医生的水平。此外,数据集的构建过程中也面临诸多挑战,如图像分辨率和比例的多样性、不同部位的异常特征复杂性,以及如何在保持数据隐私的同时进行大规模数据收集和标注。这些挑战为未来的研究提供了广阔的空间,尤其是在提升模型在不同部位的检测准确性和泛化能力方面。
常用场景
经典使用场景
MURA数据集的经典使用场景主要集中在骨科放射影像的异常检测任务中。该数据集包含了14,863个上肢骨骼的放射影像研究,每个研究由一个或多个视图组成,并由放射科医生手动标注为正常或异常。通过训练深度学习模型,研究人员可以利用MURA数据集来开发和验证自动化的异常检测算法,特别是在手指、手腕、肘部等部位的异常检测中,模型的表现与专业放射科医生的表现相当。
衍生相关工作
MURA数据集的发布激发了大量相关研究工作,特别是在医学影像的深度学习应用领域。许多研究者基于MURA数据集开发了新的模型架构和训练方法,进一步提升了异常检测的准确性和鲁棒性。此外,MURA的成功也推动了其他医学影像数据集的公开,促进了医学影像分析领域的整体发展。相关工作还包括对模型解释性的研究,如通过类激活映射(CAMs)来可视化模型关注的影像区域,从而增强模型的可解释性。
数据集最近研究
最新研究方向
近年来,MURA数据集在骨科放射学领域的研究中引起了广泛关注,尤其是在肌肉骨骼异常检测方面。该数据集通过提供大量高质量的放射图像,推动了深度学习模型在该领域的应用。研究者们利用MURA数据集训练了169层DenseNet模型,展示了其在手指和手腕异常检测中的优异表现,与资深放射科医生的诊断水平相当。然而,在肘部、前臂、手、肱骨和肩部等部位的异常检测中,模型的表现仍需进一步提升。这一挑战为未来的研究提供了方向,尤其是在提高模型在复杂解剖结构中的诊断准确性方面。此外,MURA数据集的开放性促进了医学影像分析领域的技术进步,为自动化诊断工具的开发提供了宝贵的资源。
相关研究论文
- 1MURA: Large Dataset for Abnormality Detection in Musculoskeletal Radiographs斯坦福大学 · 2018年
以上内容由遇见数据集搜集并总结生成



