five

CTSpinoPelvic1K

收藏
Hugging Face2026-04-24 更新2026-04-25 收录
下载链接:
https://huggingface.co/datasets/anonymous-mlhc/CTSpinoPelvic1K
下载链接
链接失效反馈
官方服务:
资源简介:
CTSpinoPelvic1K 是一个融合了脊柱和骨盆的 3D CT 分割数据集,通过患者级别的交叉比对从三个公开数据源构建而成。数据源包括 TCIA CT COLONOGRAPHY 的 DICOM CT 体积、CTSpine1K 的 VerSe 标准椎体标签掩码以及 CTPelvic1K dataset2 的骶骨和双侧髋关节标签掩码。数据集包含约 650 例患者的融合标注(脊柱和骨盆标注在同一系列上)和其余患者的分离标注(脊柱和骨盆标注在不同的俯卧/仰卧采集上)。数据集包含 10 类标签,涵盖腰椎(L1-L5)、L6/LSTV(腰椎化的 S1)、骶骨和双侧髋关节。所有体积数据均规范化为 PIR(后-下-右)方向,CT 及其标签图共享相同的 4×4 仿射变换,无需在训练前进行重采样。数据集还包含关于腰椎骶椎过渡椎(LSTV)的补充标注,分为椎体和骨盆来源的标注,并提供了标注一致性信息。数据集按 70/15/15 的比例划分为训练集、验证集和测试集,并按照 LSTV 类别和匹配类型进行分层。每个案例以 .npz 文件格式存储,包含 CT 体积、标签、仿射矩阵和元数据。数据集适用于医学图像分割任务,特别是脊柱和骨盆区域的 3D CT 分割。
创建时间:
2026-04-16
原始信息汇总

数据集概述:CTSpinoPelvic1K

CTSpinoPelvic1K 是一个融合了脊柱和骨盆的 3D CT 分割数据集,通过患者级别的交叉比对,整合自三个公开数据源:

  • TCIA CT COLONOGRAPHY:提供 DICOM CT 容积(每位患者包含俯卧和仰卧扫描)。
  • CTSpine1K (COLONOG 子集):提供基于 VerSe 惯例的椎体标签掩码。
  • CTPelvic1K (dataset2):提供骶骨和双侧髋关节标签掩码。

注释被放置在 TCIA CT 容积中骨骼覆盖度最高(HU > 200)的序列上,每部分解剖结构独立放置。约 650 名患者的脊柱和骨盆注释位于相同序列(融合病例),其余患者的脊柱和骨盆标签位于不同的俯卧/仰卧扫描(分离病例)。


标签说明(10 类)

ID 名称 来源
0 背景
1 L1 CTSpine1K (VerSe 标签 20 映射为 1)
2 L2 CTSpine1K (VerSe 标签 21 映射为 2)
3 L3 CTSpine1K (VerSe 标签 22 映射为 3)
4 L4 CTSpine1K (VerSe 标签 23 映射为 4)
5 L5 CTSpine1K (VerSe 标签 24 映射为 5)
6 L6 / LSTV CTSpine1K (VerSe 标签 25 映射为 6) — 腰化的 S1
7 骶骨 CTPelvic1K (dataset2 标签 1 映射为 7)
8 左侧髋骨 CTPelvic1K (dataset2 标签 2 映射为 8)
9 右侧髋骨 CTPelvic1K (dataset2 标签 3 映射为 9)

为避免腰骶移行椎病例中两种标注惯例冲突,CTPelvic1K 的骶骨标签优先于 CTSpine1K 的骶骨标签(标签 26)。


空间方向

所有容积均标准化为 PIR(后-下-右)方向。CT 和其标签图共享完全相同的 4×4 仿射矩阵,训练前无需重采样。


腰骶移行椎(LSTV)注释

每个病例包含两种互补的 LSTV 注释:

  • lstv_vertebral:根据 CTSpine1K 分割中的腰椎标签计数得出(4 → 骶化,5 → 正常,6 → 腰化)。
  • lstv_pelvic:根据 CTPelvic1K 文件名限定词得出(任何包含 "sacralization" 的子串 → 骶化)。
  • lstv_agreement:当两个来源一致时为 True,不一致时为 False,任一方无信息时为 None
  • lstv_class:整数 0–3 总结主要判断(0=正常,1=腰化,2=半骶化,3=骶化)。骨盆标签具有优先权。

数据划分

训练集 / 验证集 / 测试集比例为 70 / 15 / 15,按 (lstv_class × match_type) 分层抽样,确保每个划分包含罕见的骶化和腰化类别。


文件格式

每个病例为一个单独的 .npz 文件,位于 data/<split>/token_<N>.npz

python import numpy as np, json

d = np.load("token_17.npz", allow_pickle=False) ct = d["ct"] # int16 (Z, Y, X) HU label = d["label"] # uint8 (Z, Y, X) 0..9 affine = d["affine"] # float32 (4, 4) RAS 仿射矩阵 meta = json.loads(str(d["meta"]))

print(meta["match_type"], meta["lstv_class"], meta["spine_bone_pct"])


快速上手示例

PyTorch 示例

python from dataset_interface import CTSpinoPelvicDataset from torch.utils.data import DataLoader

ds = CTSpinoPelvicDataset( root = "anonymous-mlhc/CTSpinoPelvic1K", split = "train", cache_dir = "~/.cache/ctspinopelvic1k", ) dl = DataLoader(ds, batch_size=1, shuffle=True)

for batch in dl: ct, label = batch["ct"], batch["label"] # (B,1,Z,Y,X) / (B,Z,Y,X)

MONAI 示例

python from monai.transforms import ( Compose, RandCropByPosNegLabeld, RandFlipd, NormalizeIntensityd, ) from dataset_interface import CTSpinoPelvicDataset

transforms = Compose([ NormalizeIntensityd(keys="ct", subtrahend=0, divisor=1000), RandCropByPosNegLabeld(keys=("ct","label"), label_key="label", spatial_size=(96,96,96), pos=2, neg=1, num_samples=2), RandFlipd(keys=("ct","label"), prob=0.5, spatial_axis=(0,1,2)), ])

ds = CTSpinoPelvicDataset(root="anonymous-mlhc/CTSpinoPelvic1K", split="train", transform=transforms)


引用与许可

  • 引用:请同时引用源数据集(CTSpine1K、CTPelvic1K、TCIA CT COLONOGRAPHY)以及本衍生数据集。BibTeX 条目见 CITATION.cff
  • 许可:源数据集保留各自许可。衍生融合标签、划分和代码采用 CC BY-NC 4.0(非商业使用)。
搜集汇总
数据集介绍
main_image_url
构建方式
CTSpinoPelvic1K数据集通过患者级别的跨库匹配,融合了三个公开来源的CT数据:TCIA CT COLONOGRAPHY提供的DICOM容积图像、CTSpine1K中的椎体标注掩膜以及CTPelvic1K中的骶骨与双侧髋骨标注掩膜。对于约650例患者,脊柱与骨盆标注位于同一扫描序列(融合病例),其余则分布于不同俯卧或仰卧扫描序列(分离病例),确保了数据覆盖的完整性与多样性。
特点
该数据集共包含10个标注类别(背景、L1至L6/S1腰化椎体、骶骨、左右髋骨),其中LSTV(腰骶移行椎)通过脊柱与骨盆两套标注系统协同判定,并提供了四个层次的分类信息(正常、腰化、半骶化、骶化)。所有容积统一至PIR方向,CT与标注掩膜共享相同仿射矩阵,无需额外重采样。数据分割按LSTV类别与匹配类型分层抽样,保障稀有类别的代表性。
使用方法
数据集以.npz格式存储,每个病例包含CT图像(int16)、标注掩膜(uint8)、仿射矩阵(float32)及元数据(JSON)。支持PyTorch与MONAI框架快速调用:可通过CTSpinoPelvicDataset类加载数据,并自定义预处理流水线(如裁剪、翻转、归一化)。推荐使用96×96×96的裁剪尺寸,配合正负样本比为2:1的采样策略进行训练。
背景与挑战
背景概述
CTSpinoPelvic1K数据集由研究团队构建于近年,旨在融合脊柱与骨盆的三维CT分割任务,其核心研究问题在于如何通过患者级别的跨库关联,将来自TCIA CT结肠成像、CTSpine1K及CTPelvic1K三个公开数据源的标注信息统一到同一CT体素空间。该数据集特别关注腰骶过渡椎的细分表征,通过引入LSTV分类体系,为脊柱外科、骨科及影像组学领域提供了首个同时涵盖腰椎、骶骨与双侧髋骨的精细分割基准,显著推动了多解剖区域联合分析的研究进展。
当前挑战
该数据集面临的核心挑战包括:1)领域问题层面,腰骶过渡椎的形态学变异导致传统分割模型难以准确区分L5、骶骨与腰椎化或骶骨化的异常结构,亟需能够捕捉解剖连续性与分类模糊性的算法;2)构建过程中,因TCIA CT结肠成像包含俯卧与仰卧两种体位,约半数患者的脊柱与骨盆标注映射至不同序列,引发空间错位问题,需通过骨覆盖率(HU>200)筛选最佳匹配序列,并设计严格的优先级规则避免骶骨标注冲突。
常用场景
经典使用场景
CTSpinoPelvic1K数据集的核心应用场景在于腰骶骨盆联合三维分割任务,尤其是面向计算机断层扫描(CT)影像中腰椎(L1至L6/LSTV)、骶骨及双侧髋骨的精细解剖结构分割。该数据集通过融合TCIA CT结肠造影、CTSpine1K与CTPelvic1K三大公开数据源,构建了包含10类标签的高质量标注体积,为多器官联合分割、脊柱-骨盆过渡区形态分析以及解剖结构变异(如腰骶移行椎LSTV)的自动化检测提供了标准化训练基准。
实际应用
在实际临床场景中,CTSpinoPelvic1K可被用于开发脊柱-骨盆形态的计算机辅助诊断系统,支持骨科手术规划(如髋关节置换、脊柱融合术中的螺钉路径设计)、骨密度自动测量以及骶髂关节疾病的筛查。此外,该数据集还可服务于结肠癌筛查的CT结肠造影检查中,对影像中骨性标志物进行辅助定位,提升放射科医师对解剖结构的识别效率与一致性。
衍生相关工作
CTSpinoPelvic1K的发布催生了多项围绕多器官语义分割、解剖变异检测及跨模态校准的经典工作。其融合标注策略启发了基于多源标签一致性学习的半监督分割方法,而LSTV的三级分类标注(结合脊柱与骨盆视角)则推动了腰骶移行椎自动分型的可解释性研究。此外,该数据集与MONAI、PyTorch等深度学习框架的无缝集成,为基于Transformer的分割模型与弱监督学习范式的验证提供了标准化实验平台。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作