five

HNTSMRG-24

收藏
arXiv2024-12-10 更新2024-12-11 收录
下载链接:
http://arxiv.org/abs/2412.06610v1
下载链接
链接失效反馈
官方服务:
资源简介:
HNTSMRG-24数据集由德克萨斯大学MD安德森癌症中心创建,包含150名接受头颈部癌症治疗的患者的T2加权MRI扫描数据。数据集包括治疗前(pre-RT)和治疗中期(mid-RT)的MRI扫描,以及相应的标签掩码,用于分割原发肿瘤体积(GTVp)和转移淋巴结(GTVn)。数据集的创建过程涉及专家的手动标注,并通过15折交叉验证增强模型的鲁棒性。该数据集主要应用于放射治疗中的肿瘤分割,旨在提高治疗计划的精确性。

The HNTSMRG-24 dataset was developed by the University of Texas MD Anderson Cancer Center, containing T2-weighted MRI scans from 150 patients undergoing head and neck cancer treatment. The dataset includes MRI scans acquired prior to radiotherapy (pre-RT) and mid-radiotherapy (mid-RT), alongside corresponding label masks for segmenting the primary tumor volume (GTVp) and metastatic lymph nodes (GTVn). The creation of this dataset involved manual annotations from experts, and 15-fold cross-validation was adopted to enhance the robustness of models. This dataset is primarily utilized for tumor segmentation in radiotherapy, with the objective of improving the accuracy of treatment planning.
提供机构:
格罗宁根大学
创建时间:
2024-12-10
搜集汇总
数据集介绍
main_image_url
构建方式
HNTSMRG-24数据集的构建基于150名接受头颈部癌症(HNC)治疗的患者的T2加权MRI扫描数据。数据集包括每位患者在放疗前(pre-RT)和放疗中期(mid-RT)的MRI体积,以及这些体积的注册版本。每个MRI体积都附带由至少三位专家独立标注的标签掩码,这些掩码通过合并生成最终的标注。为了增强模型的鲁棒性和多样性,研究采用了15折交叉验证的nnU-Net V2框架,而非标准的5折交叉验证。此外,pre-RT分割任务中,训练数据通过加入相应的mid-RT数据进行了增强,而mid-RT分割任务则采用了三通道输入,包括mid-RT MRI体积、注册的pre-RT MRI体积及其对应的标签掩码。
特点
HNTSMRG-24数据集的主要特点在于其多阶段的MRI数据采集,涵盖了放疗前和放疗中期的肿瘤变化信息。每个MRI体积的标注由多位专家独立完成,确保了标注的准确性和一致性。数据集的构建采用了15折交叉验证的nnU-Net V2框架,显著提升了模型的鲁棒性和泛化能力。此外,mid-RT分割任务中引入的三通道输入设计,进一步增强了模型对肿瘤变化的捕捉能力。数据集的评估指标为Dice相似系数(DSC),通过盲测集的平均DSC值来衡量模型的分割性能。
使用方法
HNTSMRG-24数据集可用于训练和验证基于深度学习的头颈部肿瘤分割模型。研究者可以利用该数据集进行pre-RT和mid-RT任务的分割实验,分别针对原发肿瘤体积(GTVp)和转移淋巴结(GTVn)进行分割。数据集的预处理步骤由nnU-Net V2框架自动完成,包括Z-score标准化和随机裁剪等操作。模型的训练和评估可以通过15折交叉验证进行,以确保模型的鲁棒性和泛化能力。最终的分割性能通过Dice相似系数(DSC)进行评估,研究者可以根据DSC值对模型进行优化和比较。
背景与挑战
背景概述
HNTSMRG-24数据集由荷兰格罗宁根大学和格罗宁根大学医学中心的研究团队创建,专注于基于MRI的头部和颈部肿瘤分割任务。该数据集的核心研究问题是通过T2加权MRI图像,自动分割主要肿瘤体积(GTVp)和转移性淋巴结(GTVn),以支持放射治疗计划的精确性。数据集包含150名患者的MRI图像,涵盖治疗前(pre-RT)和治疗中期(mid-RT)的扫描数据,并附有专家标注的标签掩码。该数据集的创建旨在解决传统手动标注耗时且存在观察者间差异的问题,推动深度学习技术在医学图像分割中的应用,特别是针对头部和颈部癌症的放射治疗优化。
当前挑战
HNTSMRG-24数据集面临的挑战主要集中在两个方面:首先,肿瘤分割任务本身具有复杂性,尤其是在处理T2加权MRI图像时,肿瘤与周围组织的对比度较低,导致边界模糊,增加了分割的难度。其次,数据集构建过程中,面临样本数量有限的问题,尽管采用了15折交叉验证来提高模型的鲁棒性,但150名患者的样本量仍可能限制模型的泛化能力。此外,数据集中不同患者的MRI图像尺寸和分辨率存在差异,需要进行预处理以确保数据的一致性。最后,如何在保证分割精度的同时,减少模型的计算时间和资源消耗,也是该数据集面临的一个重要挑战。
常用场景
经典使用场景
HNTSMRG-24数据集主要用于基于T2加权MRI的头部和颈部肿瘤分割任务,特别是针对放射治疗前(pre-RT)和放射治疗中期(mid-RT)的肿瘤体积(GTVp)和转移性淋巴结(GTVn)的分割。该数据集通过提供150名患者的MRI扫描数据及其对应的专家标注,支持深度学习模型在医学图像分割领域的应用,尤其是使用nnU-Net框架进行15折交叉验证,以提高模型的鲁棒性和泛化能力。
解决学术问题
HNTSMRG-24数据集解决了医学图像分割中的关键问题,特别是在头部和颈部癌症的放射治疗规划中,如何准确分割肿瘤区域。传统的肿瘤轮廓标注依赖于专家手动操作,存在时间消耗大和观察者间变异性问题。该数据集通过提供高质量的MRI图像和专家标注,支持自动化分割算法的研究,显著减少了手动标注的工作量,并提高了分割的准确性和一致性。
衍生相关工作
HNTSMRG-24数据集的发布推动了基于MRI的头部和颈部肿瘤分割领域的研究进展。许多研究者基于该数据集开发了新的深度学习模型,如使用nnU-Net框架进行15折交叉验证,以提高模型的鲁棒性。此外,一些研究还探索了基于Transformer的模型(如Swin UNETR)在医学图像分割中的应用,进一步提升了分割的准确性和效率。这些衍生工作不仅丰富了医学图像分割的研究方法,还为未来的临床应用提供了新的技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作