多中心人体3D CT鬼影基准数据集
收藏arXiv2025-07-02 更新2025-07-04 收录
下载链接:
https://www.cancerimagingarchive.net/collection/ct4harmonization-multicentric/
下载链接
链接失效反馈官方服务:
资源简介:
多中心人体3D CT鬼影基准数据集是一个开源基准数据集,包含使用各种扫描仪和设置的拟人化鬼影的CT扫描图像。数据集包括来自4个制造商的13个扫描仪在8个机构使用统一协议以及多种采集剂量的1378个图像系列。数据集旨在促进AI调和技术的发展,通过减少由各种采集设置引起的分布偏移。
Multicenter Human 3D CT Ghost Artifact Benchmark Dataset is an open-source benchmark dataset containing CT scan images of anthropomorphic phantoms acquired with various scanners and acquisition parameters. The dataset comprises 1378 image series collected across 8 institutions using 13 scanners from 4 manufacturers, with both unified acquisition protocols and varying radiation exposure doses. This dataset is designed to advance the development of AI harmonization techniques by mitigating distribution shifts induced by heterogeneous acquisition settings.
提供机构:
瑞士瓦莱州管理学校信息学研究所, 瑞士洛桑大学医院核医学与分子影像学部, 瑞士巴塞尔大学医院放射学与核医学诊所, 瑞士日内瓦大学医学院, 瑞士苏黎世联邦理工学院计算机视觉实验室, 瑞士马蒂尼IDIAP研究所, 瑞士洛桑大学医院放射科, 瑞士洛桑-埃帕林格影像中心3R集团, 瑞士伯尔尼大学伯尔尼大学医院, 瑞士巴塞尔施默茨克linik Basel, 瑞士苏黎世大学医院诊断与介入放射科
创建时间:
2025-07-02
搜集汇总
数据集介绍

构建方式
多中心人体3D CT鬼影基准数据集的构建采用了3D打印的碘墨水人体模拟鬼影,该鬼影基于真实人体CT扫描数据制作,专注于肝脏区域,并包含六个来自四种不同组织类别的感兴趣区域(ROI)。数据采集过程涉及13台来自4个制造商的CT扫描仪,覆盖8个瑞士医疗机构,采用统一的扫描协议和多种剂量水平(1 mGy至14 mGy)。每台扫描仪在每种剂量下进行10次重复扫描,共计649次扫描,并通过滤波反投影(FBP)、迭代重建(IR)和深度学习重建(DL)三种算法生成1378个图像序列。
特点
该数据集的核心特点在于其高度可控的实验设计,通过固定鬼影的解剖结构,消除了患者间和患者内的变异,从而专注于研究不同扫描仪和采集参数对图像和定量特征的影响。数据集包含丰富的多中心、多制造商数据,涵盖了临床常见的剂量范围和重建算法,为研究AI算法的泛化性和数据分布偏移提供了理想平台。特别值得注意的是,肝脏区域的六个ROI具有精确的组织分类标注(如囊肿、血管瘤、转移灶和正常组织),支持特征稳定性分析和组织分类任务评估。
使用方法
数据集的使用需遵循特定的评估框架,包括两种交叉验证方案:留一扫描仪交叉验证(LOSO CV)和10折交叉验证。LOSO CV用于评估算法在未见过的扫描仪上的泛化能力,而10折CV则评估算法在混合数据上的性能。用户可从图像层面(RMSE、PSNR、SSIM)和特征层面(ICC)量化稳定性,并通过组织分类任务验证算法效果。配套的开源代码库提供了数据加载、基准测试和可视化工具,支持研究者快速开展基于该数据集的谐调算法开发。数据以DICOM格式存储,按扫描仪分类,并附带详细的采集参数和剂量信息。
背景与挑战
背景概述
多中心人体3D CT鬼影基准数据集由Mohammadreza Amirian等研究人员于2025年创建,旨在解决医学影像领域中人工智能模型泛化能力不足的问题。该数据集由瑞士多个研究机构合作开发,包括HES-SO Valais-Wallis、洛桑大学医院、巴塞尔大学医院等。数据集的核心研究问题聚焦于CT影像中由于扫描仪制造商、重建技术和剂量变化导致的数据分布偏移,通过使用3D打印的拟人体模来固定解剖和生理变异,从而专门研究影像采集参数对AI模型性能的影响。该数据集包含1378个影像系列,覆盖13台不同制造商的扫描仪和多种剂量水平,为AI协调技术的发展提供了重要基准。
当前挑战
该数据集面临的挑战主要包括两方面:领域问题的挑战和构建过程的挑战。在领域问题方面,数据集致力于解决CT影像分析中因多中心数据采集导致的分布偏移问题,这对AI模型的泛化能力提出了严峻考验,尤其是在组织分类和特征稳定性方面。构建过程中的挑战包括:1) 跨多个中心和扫描仪的协调协议设计,需平衡临床实用性和参数一致性;2) 拟人体模的精确制造,需确保其能够真实模拟人体组织特性;3) 大规模数据采集的标准化,涉及13台扫描仪、5种剂量水平和3种重建算法的复杂组合;4) 特征提取和评估方法的统一,需开发可靠的指标来衡量影像和特征层面的稳定性。
常用场景
经典使用场景
多中心人体3D CT鬼影基准数据集在医学影像分析领域具有重要应用价值,尤其在人工智能(AI)辅助CT分析中,该数据集通过提供来自不同扫描仪和设置的CT扫描,为研究数据分布偏移问题提供了标准化基准。其经典使用场景包括评估和开发AI数据协调技术,以确保模型在不同扫描仪和采集设置下的稳定性和泛化能力。
解决学术问题
该数据集解决了医学影像分析中因扫描仪制造商、重建技术和剂量变化引起的数据分布偏移问题。通过提供标准化的多中心CT扫描数据,研究人员能够开发协调技术,减少这些因素对AI模型性能的影响。其意义在于推动了跨中心数据融合和模型泛化研究,为精准医疗中的影像分析提供了可靠的数据支持。
衍生相关工作
该数据集衍生了一系列经典研究工作,主要集中在医学影像协调和特征稳定性分析领域。例如,基于该数据集的研究提出了多种图像和特征级别的协调方法,包括使用生成对抗网络(GANs)和对比学习技术。此外,该数据集还被用于评估不同重建算法对放射组学特征的影响,推动了医学影像标准化和AI模型优化的进一步发展。
以上内容由遇见数据集搜集并总结生成



