CTSpine1K

Name: CTSpine1K
Creator: 中国科学院智能信息处理重点实验室
Published: 2021-07-05 14:41:49
License: 暂无描述

arXiv2021-07-05 更新2024-06-21 收录

下载链接：

https://github.com/ICT-MIRACLE-lab/CTSpine1K

下载链接

链接失效反馈

官方服务：

资源简介：

CTSpine1K是由中国科学院智能信息处理重点实验室等机构创建的大型脊柱CT数据集，包含1005个CT体积，超过11,000个标记的椎骨，涵盖多种脊柱状况。数据集从多个开放源中收集并精心设计了统一的标注流程以确保标注质量。该数据集主要用于脊柱相关图像分析任务，如椎骨分割、标记和3D脊柱重建，旨在解决现有小规模数据集限制深度学习方法应用的问题。

CTSpine1K is a large-scale spinal CT dataset developed by the Key Laboratory of Intelligent Information Processing of the Chinese Academy of Sciences and other institutions. It comprises 1005 CT volumes and over 11,000 annotated vertebrae, covering diverse spinal conditions. The dataset was collected from multiple open-source resources, and a unified annotation workflow was meticulously designed to ensure annotation quality. This dataset is primarily used for spinal-related image analysis tasks such as vertebrae segmentation, labeling and 3D spinal reconstruction, aiming to address the problem that existing small-scale datasets restrict the application of deep learning methods.

提供机构：

中国科学院智能信息处理重点实验室

创建时间：

2021-05-31

搜集汇总

数据集介绍

构建方式

在医学影像分析领域，脊柱椎体分割是临床诊断与手术规划的关键基础。为应对现有公开数据集规模有限的挑战，CTSpine1K数据集通过整合多源数据构建而成。其采集自四个公开的CT影像子集：COLONOG、HNSCC-3DCT-RT、MSD T10及COVID-19，总计涵盖1005个CT体积数据。所有影像均统一转换为NIfTI格式，并经过严格的质量筛选，排除低质量病例。标注流程采用迭代式人机协同策略：首先基于VerSe挑战赛的公开数据训练初始分割模型，生成预测掩膜；随后由初级标注员进行初步修正，再经高级标注员审核，疑难案例则由资深脊柱外科医生最终裁定。每完成100例标注，模型即更新一次，直至全部数据标注完成，确保了标注的一致性与高精度。

特点

CTSpine1K数据集以其规模宏大与多样性著称，共包含超过11,100个标注椎体，覆盖颈椎、胸椎、腰椎及骶椎等全脊柱区域，并纳入了腰椎骶化与骶椎腰化等解剖变异案例。数据来源广泛，涉及不同设备制造商与临床场景，影像呈现了丰富的形态学变化，包括金属伪影、骨折及退行性病变等复杂条件。数据集在空间分辨率与切片数量上均保持较高一致性，平均尺寸为512×512×504，为三维深度学习模型提供了充分的训练基础。与以往数据集相比，CTSpine1K不仅规模显著扩大，而且保留了完整的周围解剖结构信息，避免了以往数据中常见的裁剪局限，从而更贴近真实临床影像的完整性。

使用方法

CTSpine1K数据集适用于脊柱影像分析的多种任务，特别是椎体分割、标记与三维重建。数据集已预先划分为训练集（610例）、公开测试集（197例）及私有测试集（198例），便于模型训练与性能评估。用户可通过提供的GitHub仓库获取数据与预训练模型，利用nnU-Net等深度学习框架进行分割实验。数据以NIfTI格式存储，兼容ITK-SNAP、3D Slicer等常用医学影像软件，支持可视化与进一步处理。研究中需注意数据许可为CC BY 4.0，使用时应引用相关论文。该数据集不仅可作为基准测试平台，还能促进跨域泛化、图像超分辨率及病理检测等前沿探索。

背景与挑战

背景概述

在医学影像分析领域，脊柱相关疾病的高发病率及其带来的社会负担，促使研究者们致力于开发精准的定量分析工具。CTSpine1K数据集由中国科学院计算技术研究所智能信息处理重点实验室等机构于2021年联合构建，旨在解决脊柱椎体分割任务中大规模标注数据匮乏的核心问题。该数据集汇集了来自多个公开源的1005例CT扫描，包含超过11,100个标注椎体，涵盖了不同脊柱状态与病理变异，为深度学习模型提供了丰富的训练资源。其出现显著推动了脊柱图像分析研究，为临床诊断与手术规划等应用奠定了坚实的数据基础。

当前挑战

CTSpine1K数据集面临的挑战主要体现在两方面：在领域问题层面，脊柱椎体分割需应对椎体位置变异、金属伪影及多种脊柱疾病（如骶椎腰化、腰椎骶化）导致的图像外观差异，这些因素使得自动化分割算法在准确区分与定位椎体时面临严峻考验。在构建过程中，数据整合与标注工作亦存在显著困难：多源CT数据的采集协议、制造商与模态差异需统一处理；而大规模医学图像标注依赖严谨的流水线设计，涉及初级标注员修正、高级标注员核查及医学专家仲裁等多级质量控制，以确保标注的精确性与一致性，此过程耗时耗力且需高度专业化知识。

常用场景

经典使用场景

在医学影像分析领域，CTSpine1K数据集为脊柱椎体分割任务提供了大规模、高质量的基准资源。该数据集通过整合来自多个开放源的CT扫描图像，涵盖了颈椎、胸椎、腰椎等不同节段的椎体，并包含多种脊柱疾病和变异情况，如骶椎腰化、腰椎骶化等。其经典使用场景在于训练和评估深度学习模型，特别是基于nnU-Net等先进架构的自动分割算法，以提升椎体分割的准确性和鲁棒性。数据集的大规模特性使得模型能够学习到丰富的解剖结构和病理变化，从而在复杂临床场景中实现可靠的分割性能。

衍生相关工作

CTSpine1K数据集催生了多项脊柱影像分析领域的经典研究工作。以该数据集为基础，研究者们开发了改进的深度学习分割架构，如结合注意力机制或多尺度特征的U-Net变体，以应对椎体形态变异和病理变化的挑战。同时，数据集被广泛应用于跨域分割、少样本学习和图像超分辨率等任务，促进了脊柱影像分析技术的泛化能力提升。相关成果在MICCAI等顶级医学影像会议上发表，并推动了VerSe等挑战赛的后续发展，形成了以大规模数据驱动为核心的脊柱研究生态。

数据集最近研究