five

Angelou0516/SPIDER

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/SPIDER
下载链接
链接失效反馈
官方服务:
资源简介:
SPIDER数据集是一个公开的腰椎MRI图像分割数据集,包含218名患者的447个矢状腰椎MRI系列,其中196个T1序列、210个T2序列和41个T2-SPACE序列。数据集提供了脊椎、椎间盘(IVDs)和椎管的参考分割。数据分为训练集(360系列)和验证集(87系列)。每系列的元数据包括患者ID、序列类型、子集(训练/验证)、性别、制造商、模型、磁场强度等。标签方案中,脊椎用连续的整数标签标记(从上到下编号),椎间盘用其上方的脊椎标记(最低的椎间盘为201,依次递增),椎管标记为100,背景为0。数据集还提供了每椎间盘的放射学评分(如Modic、Pfirrmann、突出等)。数据集的来源包括相关论文、原始Zenodo存储库和Grand Challenge网站,许可证为CC-BY 4.0。

The SPIDER dataset is a public release of lumbar spine segmentation in MR images, comprising 218 patients and 447 sagittal lumbar-spine MRI series (196 T1, 210 T2, and 41 T2-SPACE). It includes reference segmentations of vertebrae, intervertebral discs (IVDs), and spinal canal. The dataset is split into training (360 series) and validation (87 series). Per-series metadata includes patient ID, sequence type, subset (training/validation), sex, vendor, model, magnetic field strength, etc. The label scheme assigns sequential integer labels to vertebrae (numbered top-down), IVDs are labeled by the vertebra immediately above (lowest IVD = 201, next up = 202, ...), spinal canal is labeled as 100, and background as 0. The dataset also provides radiological gradings per IVD (e.g., Modic, Pfirrmann, herniation). Sources include the associated paper, original Zenodo repository, and Grand Challenge website, with a CC-BY 4.0 license.
提供机构:
Angelou0516
搜集汇总
数据集介绍
main_image_url
构建方式
SPIDER数据集源自一项严谨的医学影像研究,致力于腰椎磁共振成像中的解剖结构分割。该数据集汇集了218名患者的447个矢状位腰椎MRI序列,覆盖T1、T2及T2-SPACE三种加权成像模式。在标注过程中,T2-SPACE序列因具有近各向同性和高分辨率特性,由专家进行全手动标注,确保了最高权威性;而T1与T2序列则采用迭代半自动精化策略,并在肌肉骨骼放射科医师监督下完成修正。最终生成包含椎骨、椎间盘及椎管在内的参考分割掩膜,为模型训练提供了坚实可靠的标注基础。
特点
该数据集的核心特色在于其多维度、多层次的标注体系。分割掩膜采用独特的标签方案:椎骨按自上而下顺序以连续整数标记;椎间盘则以其上方椎骨的标签编号加上200来标识;椎管统一赋予标签100;背景为0。这种设计便于后续分析时快速提取特定结构。此外,数据集还提供了丰富的元数据,包括患者性别、设备制造商、磁场强度、序列参数以及每个椎间盘放射学分级(如Modic、Pfirrmann、疝出等),为临床研究与算法评估开辟了广阔空间。
使用方法
SPIDER数据集已整合至HuggingFace平台,便于研究人员直接加载使用。数据以训练集(360个样本)和验证集(87个样本)形式划分,通过镜像仓库可直接下载预处理好的图像与掩膜文件。研究者可利用所提供的overview.csv获取系列级别的元数据,radiological_gradings.csv则提供了椎间盘级别的临床分级信息。推荐使用T2-SPACE序列生成的掩膜作为金标准,其全手动标注精度最高;T1与T2序列的掩膜同样在专业监督下完成,适用于模型预训练或方法比较。
背景与挑战
背景概述
SPIDER数据集由van der Graaf等研究人员于2024年发布,收录于《Scientific Data》期刊,是一项面向腰椎磁共振影像分割的里程碑式资源。该数据集包含218名患者的447个矢状位MRI序列,并提供了椎体、椎间盘及椎管的高质量参考分割掩膜,旨在解决医学影像分析中腰椎结构自动分割的标注匮乏问题。研究团队来自多家机构,通过融合半自动标注与放射科医师监督校正的方式,构建了包含T1、T2及T2-SPACE多模态序列的标准化基准。该数据集的影响力体现在不仅支撑了SPIDER Grand Challenge国际竞赛,更为腰椎退行性病变的定量分析、计算机辅助诊断及手术规划提供了关键训练与验证基础,推动了医学图像分割算法在脊柱领域的临床转化。
当前挑战
SPIDER数据集所应对的领域挑战在于腰椎MRI分割任务中复杂解剖结构的精确界定,包括椎体、椎间盘与椎管的边界模糊性、个体间形态变异以及病理改变(如椎间盘突出或Modic改变)导致的标注歧义,这些因素制约了现有分割模型在真实临床场景中的泛化能力。在构建过程中,团队面临两大难题:其一,T1/T2序列图像由于分辨率较低且存在部分容积效应,需通过迭代式半自动算法结合专家反复校正才能获得可靠标注,耗时且依赖专业经验;其二,T2-SPACE序列虽具有近各向同性高分辨率优势,但完全手工标注的工作量巨大,需在精确度与效率间权衡,最终仅将41个此类序列设为最高权威标准。
常用场景
经典使用场景
SPIDER数据集在医学影像分析领域主要用于腰椎磁共振图像的语义分割任务,其经典使用场景聚焦于椎体、椎间盘及椎管等解剖结构的像素级精确勾画。研究者利用该数据集训练和评估深度学习模型,例如U-Net及其变体,旨在从矢状位MRI序列中自动识别并区分各节段的椎骨与椎间盘,同时勾勒出椎管的边界。由于数据集中包含了T1、T2及T2-SPACE多种对比度序列,为构建跨序列鲁棒的分割算法提供了丰富素材,尤其是在处理多中心、多厂商的临床MRI数据时展现出重要价值。
衍生相关工作
SPIDER数据集催生了一系列重要的学术衍生工作,包括但不限于针对其标注方案提出的层级式分割网络,如结合注意力机制的椎体-椎间盘联合定位模型。研究者还在此基础上探索了半监督学习策略,利用T2-SPACE的高精度标注指导T1/T2序列的弱监督训练,从而降低标注成本。此外,该数据集被用于验证多任务学习框架,同时完成分割与椎间盘退变分级预测。另有一些工作将其与公开的腰椎成像数据集(如Verse2020)进行联合训练,以提升模型在罕见病例上的泛化能力。Grand Challenge平台组织的公开竞赛更是催生了多种创新架构,推动了脊柱影像自动化分析领域的持续进步。
数据集最近研究
最新研究方向
在医学影像分析领域,SPIDER数据集标志着腰椎MRI分割研究迈入标准化与可复现的新阶段。该数据集汇聚了218例患者的447个矢状位序列,涵盖T1、T2及高分辨率T2-SPACE模态,并提供了椎体、椎间盘及椎管的精细参考分割掩膜。其影像与临床标注的深度融合,为深度学习模型在脊柱结构自动量化中的鲁棒性训练与验证提供了标杆基准。当前前沿方向聚焦于多模态特征对齐与跨中心泛化能力提升,例如利用T2-SPACE全手动标注作为金标准,探索半监督或自监督框架以弥合有标注数据稀缺的鸿沟。同时,伴随Modic分级、椎间盘退变等放射学评分嵌入,该数据集正驱动模型从单纯解剖分割向临床病理推理跃迁,如脊柱退行性病变的智能预后分析。SPIDER的发布亦呼应了医学影像领域开放科学运动的热潮,通过统一评测协议(源自SPIDER Grand Challenge)赋能研究者公平对比算法性能,进而推动可解释性分割网络及小样本学习策略的演进,为精准脊柱外科与大规模流行病学研究奠定基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作