TrackRAD2025挑战数据集
收藏arXiv2025-03-25 更新2025-03-27 收录
下载链接:
https://doi.org/10.57967/hf/4539
下载链接
链接失效反馈资源简介:
TrackRAD2025挑战数据集是一个多中心、多厂商的实时MRI时间序列数据集,由来自六个国际中心的585名患者组成,涵盖了胸、腹、盆腔等不同解剖区域的肿瘤图像。该数据集包括超过280万个未标记的2D sagittal cine MRI帧和超过1万个手动标记的帧,分为公开的训练集和私有的测试集,旨在支持实时肿瘤定位算法的开发和评估,推动放射治疗领域的精准治疗。
提供机构:
四川省肿瘤医院
创建时间:
2025-03-25
AI搜集汇总
数据集介绍

构建方式
TrackRAD2025挑战数据集是通过多中心协作构建的,涵盖了来自六个国际医疗中心的585名患者的2D矢状面动态MRI序列。数据采集使用了0.35 T和1.5 T两种磁共振直线加速器(MRI-linac)系统,覆盖了胸部、腹部和盆腔等多个解剖区域。数据集包含了超过280万帧未标记的MRI图像和1万帧手动标记的图像,标记过程由多名经验丰富的医学专家完成,并通过STAPLE算法生成统一的参考标准。数据经过格式转换、重采样和压缩处理,最终以MetaImage(MHA)格式存储。
特点
TrackRAD2025数据集以其多中心、多厂商的特点脱颖而出,涵盖了不同磁场强度和采样频率的MRI图像,反映了真实的临床场景。数据集中的标记数据经过严格的专家审核和一致性验证,Dice相似系数(DSC)达到0.94±0.07,显示了高度的结构重叠一致性。此外,数据集包含了呼吸暂停和自由呼吸状态下的图像,为目标跟踪算法提供了丰富的运动模式样本。数据的多样性和高质量标注使其成为开发实时肿瘤定位算法的理想资源。
使用方法
TrackRAD2025数据集的使用方法灵活多样,适用于监督学习和无监督学习任务。公开的训练集包含477例未标记数据和50例标记数据,可用于模型训练和验证。测试集则通过挑战平台提交评估,确保算法的公平比较。数据以MHA格式提供,支持使用ITK或SimpleITK等开源工具进行读取和处理。用户还可以通过3DSlicer等软件可视化图像和标记。数据集的使用遵循CC BY-NC许可,鼓励非商业用途的研究和创新。详细的代码示例和数据加载指南可在GitHub仓库中找到,方便研究者快速上手。
背景与挑战
背景概述
TrackRAD2025挑战数据集由国际多中心研究团队共同构建,旨在推动磁共振引导放射治疗(MRIgRT)中实时肿瘤追踪算法的发展。该数据集发布于2025年,汇集了来自荷兰、德国、澳大利亚和中国六家医疗机构的585例患者数据,涵盖胸、腹、盆腔等多个解剖部位,采用0.35T和1.5T两种磁共振直线加速器(MRI-linac)采集的矢状面2D动态磁共振影像。作为首个公开的多中心实时肿瘤追踪基准数据集,其通过标准化平台解决了该领域长期缺乏公共评估数据的问题,为提升放疗中运动管理的精准度提供了关键基础设施。
当前挑战
该数据集面临的核心挑战体现在两个维度:其一,在领域问题层面,需解决动态MRI影像中因呼吸运动导致的肿瘤非刚性形变(中位形变位移达3.1mm)及低对比度目标分割(DSC波动范围0.0-1.0)等难题;其二,在构建过程中需克服多中心数据异构性挑战,包括不同磁场强度(0.35T/1.5T)、采样频率(1.3-8Hz)、空间分辨率(1.0×1.0mm至3.5×3.5mm)的协议差异,以及超过2.8万帧影像的人工标注质量控制(标注者间DSC 0.94±0.07)。这些挑战对开发鲁棒的实时追踪算法提出了严格要求。
常用场景
经典使用场景
TrackRAD2025挑战数据集作为首个公开的多机构实时MRI引导放疗肿瘤追踪数据集,其经典应用场景聚焦于开发与评估基于2D电影MRI序列的实时肿瘤定位算法。在混合MRI-直线加速器(MRI-linac)系统中,该数据集通过提供来自不同磁场强度(0.35 T和1.5 T)的585例患者数据,支持研究者测试算法在呼吸运动、器官形变等复杂条件下的鲁棒性。其标注的108例病例(含10,000帧手动分割图像)尤其适用于监督学习模型的训练,而未标注的477例病例(280万帧)则为无监督或半监督方法提供了探索空间。
实际应用
在实际临床中,TrackRAD2025数据集直接服务于MRI-linac系统的精准放疗流程优化。例如,针对胸腹部肿瘤(占数据集73%)的呼吸运动管理,该数据支持的算法可减少治疗中靶区外放边界,降低健康组织受量。中国四川癌症中心等机构利用其1.5 T MRI-linac数据开发的实时分割模型,已实现亚毫米级追踪精度(中心距离误差1.2±0.9 mm),显著提升肝癌立体定向放疗的靶区覆盖率。数据集涵盖的呼吸暂停与自由呼吸混合模式(20-30%病例)进一步增强了临床适用性。
衍生相关工作
基于该数据集衍生的经典工作包括三大方向:一是LMU慕尼黑大学医院开发的STAPLE多观察者标注融合框架,解决了分割标签的异质性问题;二是阿姆斯特丹UMC利用径向采集序列(8 Hz)数据提出的时空卷积网络,将追踪延迟压缩至200毫秒内;三是悉尼大学团队结合生成对抗网络(GAN)的域适应方法,实现了0.35 T与1.5 T系统间的跨磁场强度模型迁移。这些成果均通过TrackRAD2025挑战赛平台(https://trackrad2025.grand-challenge.org/)公开验证,形成MRIgRT领域的新方法论范式。
以上内容由AI搜集并总结生成



