five

SynthRAD2025 Grand Challenge dataset|医学图像合成数据集|放疗技术数据集

收藏
arXiv2025-02-25 更新2025-02-28 收录
医学图像合成
放疗技术
下载链接:
https://doi.org/10.5281/zenodo.14918089
下载链接
链接失效反馈
资源简介:
SynthRAD2025数据集是由欧洲五个大学医学中心提供的,包含2362个病例,分为训练集、验证集和测试集,旨在推动医学图像合成技术在放疗领域的应用。该数据集包含了头部和颈部、胸部和腹部癌症患者的MRI-CT和CBCT-CT图像对,可用于合成CT生成算法的开发、验证和基准测试,以促进个性化癌症护理和改善适应性放疗工作流程。
提供机构:
德国慕尼黑大学医院,荷兰格罗宁根大学医学中心,荷兰奈梅亨大学医学中心,德国科隆大学医院,荷兰乌德勒支大学医学中心,德国海德堡癌症研究中心,瑞典隆德大学,德国癌症 consortium (DKTK),德国巴伐利亚癌症研究中心
创建时间:
2025-02-25
AI搜集汇总
数据集介绍
main_image_url
构建方式
SynthRAD2025 Grand Challenge dataset 是一个多中心、多模态的医疗影像数据集,旨在推动合成CT(sCT)生成算法的发展。该数据集由五个欧洲大学医疗中心提供,包括2362个案例,其中890个是MRI-CT配对,1472个是CBCT-CT配对。数据采集涵盖了头颈、胸部和腹部癌症患者的治疗过程,并采用了多种扫描仪和采集协议。数据预处理包括刚性图像配准、去面容化、重采样和轮廓分割,以确保数据质量和标准化。
特点
SynthRAD2025 Grand Challenge dataset 的特点在于其多中心、多模态和大规模。它包含了来自不同医疗中心的多样化数据,覆盖了头颈、胸部和腹部三个解剖区域,为研究人员提供了丰富的数据资源。数据集的预处理流程保证了数据的质量和标准化,便于研究人员进行算法开发和评估。此外,数据集还提供了详细的元数据,包括采集参数和配准细节,方便研究人员了解数据背景。
使用方法
SynthRAD2025 Grand Challenge dataset 的使用方法主要包括下载、解压和加载数据。数据集以MetaImage (.mha) 文件格式提供,可以使用ITK或SimpleITK等工具进行读取和操作。研究人员可以根据需要选择MRI-to-CT或CBCT-to-CT任务进行算法开发和评估。此外,数据集还提供了预处理代码和参数文件,方便研究人员复现研究结果。需要注意的是,数据集的下载和使用需要遵守相应的许可证规定。
背景与挑战
背景概述
在当今的放射治疗领域,医学影像技术扮演着至关重要的角色,它不仅帮助进行诊断和治疗计划,还用于治疗过程中的监测。随着合成影像技术的不断发展,特别是在合成计算机断层扫描(sCT)方面,其在放射治疗中的应用越来越受到关注。SynthRAD2025数据集及其配套的SynthRAD2025 Grand Challenge的目的是通过提供一个平台来全面评估和基准化基于锥束CT(CBCT)和磁共振成像(MRI)的合成CT生成算法,以推动合成CT生成算法的进步。该数据集由欧洲五个大学的医学中心收集,包括2362个病例,其中包括890个MRI-CT对和1472个CBCT-CT对,涵盖了头颈、胸和腹部癌症患者的治疗数据。这些数据是在2025年由Adrian Thummerer等研究人员创建的,他们来自德国、荷兰和瑞典的多个机构。该数据集的创建为放射治疗领域带来了重大影响,因为它促进了个性化癌症护理和自适应放射治疗工作流程的改进。
当前挑战
SynthRAD2025数据集和相关挑战面临的主要挑战包括:1)在MRI和CBCT图像中缺乏电子密度信息,这限制了直接进行剂量计算的能力;2)CBCT图像质量的限制,由于散射和其他CBCT成像伪影的影响,CBCT图像的质量通常低于诊断扇形束CT;3)数据集中存在异质性,由于不同中心使用了不同的成像协议和扫描仪,这增加了开发通用sCT生成算法的难度;4)由于伦理考虑和数据隐私问题,详细的患者特征(如年龄、性别、肿瘤类型和分期)并未在数据集中统一提供,这限制了进行子群分析或评估算法在特定患者人群中的表现的能力;5)预处理过程中的一些步骤,如重采样、去面化和轮廓分割,可能会在一定程度上降低数据质量。
常用场景
经典使用场景
SynthRAD2025 Grand Challenge dataset 是一个在放射治疗领域具有里程碑意义的数据集,它主要被用于生成合成的CT图像,以便在放射治疗过程中替代传统的CT扫描。这个数据集由多个欧洲大学医疗中心收集,涵盖了头部、颈部、胸部和腹部癌症患者的数据,为放射治疗中的图像合成研究提供了宝贵的资源。
衍生相关工作
SynthRAD2025 Grand Challenge dataset 衍生了许多相关的经典工作。例如,通过这个数据集,研究人员可以开发、验证和基准sCT生成算法,推动放射治疗领域的科技进步。此外,SynthRAD2025 Grand Challenge dataset 还可以用于在线自适应放射治疗的研究,提高放射治疗的精确性和效率。
数据集最近研究
最新研究方向
在放射治疗领域,合成CT(sCT)的生成对于准确的治疗计划和剂量计算至关重要。SynthRAD2025 Grand Challenge数据集的发布,为研究人员提供了一个多中心、多模态、高质量的影像数据集,旨在推动sCT生成算法的发展。该数据集包含MRI-CT和CBCT-CT配对图像,涵盖头部和颈部、胸部和腹部癌症患者的病例。通过这个数据集,研究人员可以开发和测试基于深度学习的sCT生成算法,以改善放射治疗中的剂量计算和器官分割。此外,该数据集还可以用于评估不同算法的性能,并促进个性化癌症治疗和适应性放射治疗工作流程的改进。SynthRAD2025 Grand Challenge数据集的发布,为放射治疗领域的研究人员提供了一个宝贵的资源,有助于推动sCT生成算法的发展和临床应用。
相关研究论文
  • 1
    SynthRAD2025 Grand Challenge dataset: generating synthetic CTs for radiotherapy德国慕尼黑大学医院,荷兰格罗宁根大学医学中心,荷兰奈梅亨大学医学中心,德国科隆大学医院,荷兰乌德勒支大学医学中心,德国海德堡癌症研究中心,瑞典隆德大学,德国癌症 consortium (DKTK),德国巴伐利亚癌症研究中心 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录