Angelou0516/HNTSMRG

Name: Angelou0516/HNTSMRG
Creator: Angelou0516
Published: 2026-04-30 20:53:22
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/Angelou0516/HNTSMRG

下载链接

链接失效反馈

官方服务：

资源简介：

HNTSMRG 2024数据集是MICCAI挑战赛的公开训练数据，主要用于头颈部肿瘤的MRI图像分割。数据集包含150名患者的T2加权MRI图像，每个患者有两个时间点的数据（放疗前和放疗中），并提供了专家共识的分割标签。数据集的模态为T2加权解剖MRI（混合脂肪抑制和非脂肪抑制），身体部位为头颈部（口咽癌和原发灶不明的癌症）。标签包括背景（0）、原发肿瘤（GTVp，1）和受累淋巴结（GTVn，2）。注释由3-4名专家医师完成，并通过STAPLE共识融合（在极端分歧情况下由教师仲裁）。数据集总大小约为15 GB，许可证为CC-BY-NC-4.0，来源为Zenodo。数据集支持两个分割任务：放疗前分割（基线MRI上的GTVp和GTVn）和放疗中分割（治疗中MRI上的GTVp和GTVn，并提供放疗前数据作为先验）。

The HNTSMRG 2024 dataset is the public training data for the MICCAI Challenge, primarily used for MRI image segmentation of head and neck tumors. The dataset includes T2-weighted MRI images from 150 patients, with data from two timepoints (pre-radiotherapy and mid-radiotherapy), and provides expert-consensus segmentation labels. The modality of the dataset is T2-weighted anatomical MRI (a mix of fat-suppressed and non-fat-suppressed), and the body part is the head and neck (oropharyngeal cancer and cancer of unknown primary). Labels include background (0), primary tumor (GTVp, 1), and involved lymph nodes (GTVn, 2). Annotations were performed by 3-4 expert physicians and fused via STAPLE consensus (with faculty arbitration in extreme disagreement cases). The total size of the dataset is approximately 15 GB, licensed under CC-BY-NC-4.0, and sourced from Zenodo. The dataset supports two segmentation tasks: pre-RT segmentation (GTVp and GTVn on baseline MRI) and mid-RT segmentation (GTVp and GTVn on intra-treatment MRI, with pre-RT data provided as a prior).

提供机构：

Angelou0516

搜集汇总

数据集介绍

构建方式

HNTSMRG数据集源于MICCAI 2024挑战赛，聚焦于磁共振引导下的头颈部肿瘤分割任务。该数据集采集了150名头颈部癌症患者（包括口咽癌和原发灶不明癌）的T2加权MRI影像，每位患者在放疗前（pre-RT）和放疗中（mid-RT）两个时间点分别进行扫描，形成共计300个样本对。影像数据分为脂肪抑制与非脂肪抑制两种类型。标注过程由3至4位经验丰富的放射肿瘤学专家独立勾画原发肿瘤体积（GTVp）和转移性淋巴结（GTVn），而后通过STAPLE算法融合多专家标注结果，对于意见极端分歧的病例则由仲裁专家裁定，最终生成金标准掩膜。此外，组织者利用SimpleITK工具对放疗前影像进行了刚性与可变形配准，将其与放疗中影像空间对齐，作为可选的先验信息纳入任务设计中。

特点

该数据集具有鲜明的多维度与多任务特性。首先，每个患者均跨两个治疗时间点采集数据，为肿瘤放疗过程中的动态变化分析提供了天然的时间序列信息。其次，分割标签采用三级体系（背景为0、原发肿瘤为1、转移淋巴结为2），能够精细化区分不同类型的病灶区域。标注流程采用多专家共识机制与STAPLE算法融合，显著提升了标注的可靠性与客观性，特别在医学影像中减少了个体标注者的偏差。此外，数据集专门设计了两个竞赛任务：基线期单时间点分割（Task 1）和引入配准先验信息的治疗中期分割（Task 2），为研究时序影像融合与配准信息利用等技术提供了标准验证平台。

使用方法

该数据集以结构化目录形式组织，每位患者的文件夹包含preRT和midRT两个子目录，各存放对应时间点的T2加权MRI（.nii.gz格式）和金标准掩膜文件，midRT子目录额外提供配准后的放疗前影像及对应掩膜。用户可依据任务类型选取相应的数据子集：Task 1可直接使用preRT中的原始影像及掩膜；Task 2则推荐同时利用midRT中的治疗中期数据和配准后的先验掩膜。数据集的总大小约15 GB，适合加载至深度学习框架中进行模型训练与评估。建议采用nibabel或SimpleITK库读取NIfTI格式数据，并结合医学影像分割领域标准的数据增强与损失函数策略进行模型优化。引用时请参照提供的BibTeX条目标注出处。

背景与挑战

背景概述

HNTSMRG 2024数据集是由MICCAI 2024挑战赛推出的专为磁共振引导头颈肿瘤分割设计的高质量医学影像资源，由Kareem A. Wahid、Cem Dede、Clifton D. Fuller等研究人员及机构共同构建，于2024年发布。该数据集聚焦于头颈部癌症（如口咽癌及原发灶不明癌）的精准放射治疗领域，核心研究问题在于利用治疗前（pre-RT）和治疗中期（mid-RT）两个时间点的T2加权MRI影像，对原发肿瘤体积（GTVp）和转移淋巴结（GTVn）进行语义分割，旨在推动影像引导自适应放疗的发展。通过提供150名患者的300例3D MRI扫描及由3至4名专家医师经STAPLE共识算法融合注释的金标准掩膜，该数据集为多时间点比较和分割算法验证奠定了坚实基础，显著促进了头颈肿瘤影像组学与临床治疗规划的交叉研究。

当前挑战

HNTSMRG数据集着力解决头颈肿瘤放疗规划中的两大核心挑战：一是跨时间点（pre-RT与mid-RT）的肿瘤分割一致性，由于放疗过程中肿瘤体积和形状发生非线性变化，要求模型具备时序适应性和鲁棒性；二是原发灶与转移淋巴结（GTVp与GTVn）的精细辨准，两者在影像上常呈现相似灰度分布和复杂解剖边界，极易造成误分割。在构建过程中，研究团队面临多重技术难题：同一病例的pre-RT与mid-RT图像需通过刚性加可形变配准（SimpleITK实现）对齐，但软组织形变与器官位移常导致配准误差；此外，四名专家医师的标注结果须经由STAPLE共识算法综合，极端分歧案例还需高级仲裁，极大增加了标注流程的复杂度与时间成本，确保最终掩膜兼具临床准确性与可重复性。

常用场景

经典使用场景

头颈部肿瘤的精确分割是放射治疗计划中的关键步骤，尤其是基于磁共振成像的引导治疗日益受到重视。HNTSMRG数据集聚焦于治疗前（pre-RT）与治疗中（mid-RT）两个时间点的T2加权MRI图像，为头颈癌患者的原发性肿瘤体积（GTVp）和转移性淋巴结（GTVn）提供了专家共识级别的像素级标注。该数据集最经典的用途是训练和验证深度学习模型，以完成多类别的医学图像分割任务，包括基线期的肿瘤勾勒以及治疗中期适应性的靶区更新。其独特的双时间点设计，使得模型能够捕捉肿瘤在放射治疗过程中的形态与体积变化，从而为精准放射治疗中的剂量调整与疗效评估提供影像学基础。

实际应用

在实际临床应用中，HNTSMRG数据集驱动的分割模型可直接嵌入磁共振引导放射治疗系统，用于自动化生成初始靶区轮廓以及在线自适应治疗计划。例如，在头颈部肿瘤的每日分次放疗中，基于治疗中MRI的快速分割结果能够辅助放射肿瘤医师快速调整照射野，实现对肿瘤退缩或位移的实时补偿。此外，该数据集还可用于开发患者疗效预测工具，通过量化治疗前后的肿瘤负荷变化，为个体化方案优化提供定量支持。其所涵盖的多种脂肪抑制序列MRI数据，也促使模型对不同扫描参数与设备间差异具备更强的鲁棒性，加速了从研究到临床工作站的转化进程。

衍生相关工作

HNTSMRG数据集作为MICCAI 2024挑战赛的官方数据，催生了大量创新性分割架构与学习范式。相关工作包括基于Transformer与卷积混合编码器的双时相融合网络，用于联合挖掘空间与时间维度的特征；以及利用对比学习框架从配对MRI中提取肿瘤演变表征，提升少样本场景下的分割性能。此外，基于该数据集的预训练模型被迁移至其他头颈部肿瘤亚型（如口咽癌与未知原发癌）的分割任务，验证了跨场景特征的可复用性。部分研究还探索了不确定性量化技术，通过集成标注共识信息来校准模型的置信度输出，为高风险临床决策提供了更可靠的方案。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集