five

Medical Segmentation Decathlon (MSD) datasets

收藏
arXiv2019-02-25 更新2024-06-21 收录
下载链接:
http://medicaldecathlon.com/
下载链接
链接失效反馈
官方服务:
资源简介:
医学分割十项全能(MSD)数据集是由纪念斯隆-凯特琳癌症中心等多家机构合作创建的大型注释医学图像数据集。该数据集包含2633个三维图像,涵盖多种感兴趣的解剖结构、多种模态和来源,用于支持语义分割算法的开发和评估。数据集通过开放源许可证提供,旨在通过全面的基准测试客观评估通用分割方法,并为研究领域提供开放和免费的医学图像数据。数据集的应用领域广泛,包括肿瘤、心脏、肝脏等器官的分割,旨在解决临床治疗规划和肿瘤体积测量等问题。

The Medical Segmentation Decathlon (MSD) dataset is a large-scale annotated medical imaging dataset collaboratively developed by multiple institutions including Memorial Sloan Kettering Cancer Center. This dataset comprises 2633 3D images, covering a diverse range of anatomical structures of interest, imaging modalities and data sources, and is designed to support the development and evaluation of semantic segmentation algorithms. Distributed under an open-source license, the dataset aims to objectively evaluate general-purpose segmentation methods through comprehensive benchmarking, while providing open and free medical imaging data for the global research community. It has a wide range of application scenarios, including segmentation of targets such as tumors, heart, liver and other anatomical structures, with the goal of addressing practical clinical issues including treatment planning and tumor volume quantification.
提供机构:
纪念斯隆-凯特琳癌症中心
创建时间:
2019-02-25
搜集汇总
数据集介绍
main_image_url
构建方式
Medical Segmentation Decathlon (MSD) 数据集通过多机构合作构建,涵盖了多种临床相关的解剖结构,旨在为语义分割算法的开发和评估提供高质量的医学图像数据。数据集的构建过程包括从多个机构收集2,633个三维医学图像,涵盖多种解剖部位和成像模态。所有图像均经过去标识化处理,并转换为NIfTI格式,以确保数据的易用性和互操作性。数据集的标注由专家完成,确保了标签的准确性和可靠性。
特点
MSD数据集的特点在于其多样性和广泛性,涵盖了从脑肿瘤到心脏、肝脏、胰腺等多个解剖部位的医学图像。数据集中的图像来自不同的设备和采集协议,反映了真实世界中的临床多样性。每个数据集都经过精心挑选,以确保其适用于语义分割算法的开发。此外,数据集的标注由专家完成,确保了标签的高质量。数据集还提供了详细的JSON描述文件,便于研究人员快速理解和使用数据。
使用方法
MSD数据集的使用方法非常灵活,研究人员可以通过下载数据集并利用NIfTI格式的图像进行语义分割算法的开发和评估。数据集提供了训练集和测试集,研究人员可以使用这些数据进行模型的训练和验证。数据集还支持多种软件平台,如3D Slicer、ITK Snap和MATLAB,便于研究人员进行图像处理和分析。此外,数据集的使用遵循Creative Commons CC-BY-SA 4.0许可,允许研究人员自由共享和改进数据,但需注明出处。
背景与挑战
背景概述
Medical Segmentation Decathlon (MSD) 数据集由多个国际知名研究机构联合创建,旨在为医学图像分割算法的开发与评估提供高质量的标注数据。该数据集于2019年发布,涵盖了多种临床相关的解剖结构,包括脑肿瘤、心脏、肝脏、海马体等十个不同的分割任务。通过多机构合作,MSD数据集汇集了2633个三维医学图像,涵盖了多种成像模态和临床场景。该数据集的创建不仅推动了医学图像分割算法的标准化评估,还为研究人员提供了开放且免费的数据资源,极大地促进了医学图像分析领域的发展。
当前挑战
MSD数据集在解决医学图像分割问题时面临多重挑战。首先,医学图像的多样性和复杂性使得通用分割算法的开发极具挑战性,尤其是在不同解剖结构和成像模态之间的泛化能力。其次,数据集的构建过程中,隐私保护和数据去标识化是主要障碍,尤其是在涉及患者敏感信息时,必须严格遵守健康信息隐私法规。此外,高质量的专家标注是数据集构建的核心,但标注过程耗时且成本高昂,尤其是在多机构协作的情况下,标注标准的一致性难以保证。最后,数据集的多样性和规模虽然为算法评估提供了丰富的场景,但也增加了算法在不同任务间的适应性和鲁棒性验证的难度。
常用场景
经典使用场景
Medical Segmentation Decathlon (MSD) 数据集广泛应用于医学图像分割算法的开发与评估。该数据集包含了多种临床相关解剖结构的标注图像,涵盖了从脑肿瘤到肝脏、心脏等多个器官的复杂分割任务。研究人员利用这些数据进行算法训练和验证,特别是在多任务分割场景下,MSD 数据集为开发通用型分割模型提供了丰富的实验基础。
实际应用
在实际应用中,MSD 数据集为临床诊断和治疗规划提供了重要支持。例如,脑肿瘤分割任务的数据可用于辅助神经外科医生制定手术方案,而肝脏和胰腺的分割数据则有助于肿瘤体积的精确测量和治疗效果的评估。此外,该数据集还被用于开发自动化分割工具,减少临床医生手动标注的工作量,提高诊断效率和准确性。
衍生相关工作
MSD 数据集催生了许多经典的研究工作。例如,基于该数据集的深度学习模型在 MICCAI 2018 的 Medical Segmentation Decathlon 挑战赛中表现出色,推动了多任务分割算法的发展。此外,许多研究利用 MSD 数据集进行跨领域迁移学习,探索了从单一任务到多任务分割的泛化能力。这些工作不仅提升了医学图像分割的技术水平,也为未来的临床应用奠定了坚实的基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作