five

TrackRAD2025挑战数据集|医学影像分析数据集|放射治疗数据集

收藏
arXiv2025-03-25 更新2025-03-27 收录
医学影像分析
放射治疗
下载链接:
https://doi.org/10.57967/hf/4539
下载链接
链接失效反馈
资源简介:
TrackRAD2025挑战数据集是一个多中心、多厂商的实时MRI时间序列数据集,由来自六个国际中心的585名患者组成,涵盖了胸、腹、盆腔等不同解剖区域的肿瘤图像。该数据集包括超过280万个未标记的2D sagittal cine MRI帧和超过1万个手动标记的帧,分为公开的训练集和私有的测试集,旨在支持实时肿瘤定位算法的开发和评估,推动放射治疗领域的精准治疗。
提供机构:
四川省肿瘤医院
创建时间:
2025-03-25
AI搜集汇总
数据集介绍
main_image_url
构建方式
TrackRAD2025挑战数据集是通过多中心协作构建的,涵盖了来自六个国际医疗中心的585名患者的2D矢状面动态MRI序列。数据采集使用了0.35 T和1.5 T两种磁共振直线加速器(MRI-linac)系统,覆盖了胸部、腹部和盆腔等多个解剖区域。数据集包含了超过280万帧未标记的MRI图像和1万帧手动标记的图像,标记过程由多名经验丰富的医学专家完成,并通过STAPLE算法生成统一的参考标准。数据经过格式转换、重采样和压缩处理,最终以MetaImage(MHA)格式存储。
特点
TrackRAD2025数据集以其多中心、多厂商的特点脱颖而出,涵盖了不同磁场强度和采样频率的MRI图像,反映了真实的临床场景。数据集中的标记数据经过严格的专家审核和一致性验证,Dice相似系数(DSC)达到0.94±0.07,显示了高度的结构重叠一致性。此外,数据集包含了呼吸暂停和自由呼吸状态下的图像,为目标跟踪算法提供了丰富的运动模式样本。数据的多样性和高质量标注使其成为开发实时肿瘤定位算法的理想资源。
使用方法
TrackRAD2025数据集的使用方法灵活多样,适用于监督学习和无监督学习任务。公开的训练集包含477例未标记数据和50例标记数据,可用于模型训练和验证。测试集则通过挑战平台提交评估,确保算法的公平比较。数据以MHA格式提供,支持使用ITK或SimpleITK等开源工具进行读取和处理。用户还可以通过3DSlicer等软件可视化图像和标记。数据集的使用遵循CC BY-NC许可,鼓励非商业用途的研究和创新。详细的代码示例和数据加载指南可在GitHub仓库中找到,方便研究者快速上手。
背景与挑战
背景概述
TrackRAD2025挑战数据集由国际多中心研究团队共同构建,旨在推动磁共振引导放射治疗(MRIgRT)中实时肿瘤追踪算法的发展。该数据集发布于2025年,汇集了来自荷兰、德国、澳大利亚和中国六家医疗机构的585例患者数据,涵盖胸、腹、盆腔等多个解剖部位,采用0.35T和1.5T两种磁共振直线加速器(MRI-linac)采集的矢状面2D动态磁共振影像。作为首个公开的多中心实时肿瘤追踪基准数据集,其通过标准化平台解决了该领域长期缺乏公共评估数据的问题,为提升放疗中运动管理的精准度提供了关键基础设施。
当前挑战
该数据集面临的核心挑战体现在两个维度:其一,在领域问题层面,需解决动态MRI影像中因呼吸运动导致的肿瘤非刚性形变(中位形变位移达3.1mm)及低对比度目标分割(DSC波动范围0.0-1.0)等难题;其二,在构建过程中需克服多中心数据异构性挑战,包括不同磁场强度(0.35T/1.5T)、采样频率(1.3-8Hz)、空间分辨率(1.0×1.0mm至3.5×3.5mm)的协议差异,以及超过2.8万帧影像的人工标注质量控制(标注者间DSC 0.94±0.07)。这些挑战对开发鲁棒的实时追踪算法提出了严格要求。
常用场景
经典使用场景
TrackRAD2025挑战数据集作为首个公开的多机构实时MRI引导放疗肿瘤追踪数据集,其经典应用场景聚焦于开发与评估基于2D电影MRI序列的实时肿瘤定位算法。在混合MRI-直线加速器(MRI-linac)系统中,该数据集通过提供来自不同磁场强度(0.35 T和1.5 T)的585例患者数据,支持研究者测试算法在呼吸运动、器官形变等复杂条件下的鲁棒性。其标注的108例病例(含10,000帧手动分割图像)尤其适用于监督学习模型的训练,而未标注的477例病例(280万帧)则为无监督或半监督方法提供了探索空间。
实际应用
在实际临床中,TrackRAD2025数据集直接服务于MRI-linac系统的精准放疗流程优化。例如,针对胸腹部肿瘤(占数据集73%)的呼吸运动管理,该数据支持的算法可减少治疗中靶区外放边界,降低健康组织受量。中国四川癌症中心等机构利用其1.5 T MRI-linac数据开发的实时分割模型,已实现亚毫米级追踪精度(中心距离误差1.2±0.9 mm),显著提升肝癌立体定向放疗的靶区覆盖率。数据集涵盖的呼吸暂停与自由呼吸混合模式(20-30%病例)进一步增强了临床适用性。
衍生相关工作
基于该数据集衍生的经典工作包括三大方向:一是LMU慕尼黑大学医院开发的STAPLE多观察者标注融合框架,解决了分割标签的异质性问题;二是阿姆斯特丹UMC利用径向采集序列(8 Hz)数据提出的时空卷积网络,将追踪延迟压缩至200毫秒内;三是悉尼大学团队结合生成对抗网络(GAN)的域适应方法,实现了0.35 T与1.5 T系统间的跨磁场强度模型迁移。这些成果均通过TrackRAD2025挑战赛平台(https://trackrad2025.grand-challenge.org/)公开验证,形成MRIgRT领域的新方法论范式。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

中国车牌识别数据集(7类,33万张)

这是一个高质量、平衡的中国车牌识别数据集,包含了33万张各类中国车牌的图片。数据集经过精心设计,确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。

魔搭社区 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录