five

Angelou0516/VERSE20

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/VERSE20
下载链接
链接失效反馈
官方服务:
资源简介:
VERSE20是2020年MICCAI挑战赛中的3D CT椎骨分割基准数据集。该数据集包含多探测器、多供应商的CT扫描图像,覆盖颈椎(C1-C7)、胸椎(T1-T12)和腰椎(L1-L6)区域,并提供了手动校正的每块椎骨分割掩码。数据集包含约286个独特受试者的303个CT体积,分为训练集(104)、验证集(99)和测试集(100)三个部分,共标注了4,142块椎骨。数据采用CC BY-SA 4.0许可,主要用于医学图像分析中的脊椎分割任务。

VERSE20 is a 3D CT vertebrae segmentation benchmark from the MICCAI 2020 challenge. It consists of multi-detector, multi-vendor CT scans of the cervical (C1–C7), thoracic (T1–T12), and lumbar (L1–L6) spine with manually corrected per-vertebra segmentation masks. The dataset contains approximately 286 unique subjects with 303 CT volumes, split into training (104), validation (99), and test (100) sets, totaling 4,142 annotated vertebrae. Licensed under CC BY-SA 4.0, it serves as a resource for medical image segmentation tasks.
提供机构:
Angelou0516
搜集汇总
数据集介绍
main_image_url
构建方式
VERSE20数据集源自2020年MICCAI挑战赛,旨在推动三维CT脊柱分割的基准研究。该数据集收录了来自多厂家多排探测器CT扫描的约286名受试者的303个脊柱容积图像,覆盖颈椎C1至C7、胸椎T1至T12及腰椎L1至L6等全脊柱节段。所有图像均经过人工校正,提供逐椎体分割掩膜,并严格按照解剖位置编码为1至25的体素值(含罕见过渡椎T13编码28),确保分割标签的精细度和一致性。数据按训练(104例)、验证(99例)和测试(100例)三个子集划分,每个病例可包含多个不同重建方向的采集序列(如各向同性、矢状面、冠状面),并以NIfTI格式存储CT容积与分割掩膜,同时配备椎体质心JSON文件,构建出一个结构清晰、层次分明的三维医学图像库。
特点
VERSE20数据集在脊柱分割领域具有鲜明特色。首先,其覆盖范围广泛,从颈椎、胸椎到腰椎甚至罕见过渡椎(如L6和T13)均被纳入,充分体现了真实临床中解剖变异的多样性。其次,数据源自多家影像设备厂商,扫描参数各异,这增强了模型在实际多中心部署时的泛化能力。此外,每个病例可能拥有多个采集方向(各向同性、矢状面、冠状面),为研究不同重建协议下的分割鲁棒性提供了宝贵资源。最引人注目的是,人工校正的分割掩膜采用逐椎体体素编码机制,不仅适用于语义分割,还可直接用于实例分割任务,配合提供的质心坐标文件,极大便利了椎体检测与定位方法的开发与评估。
使用方法
使用VERSE20数据集时,研究者可直接从Hugging Face或OSF平台下载原始NIfTI文件及分割掩膜,文件目录按训练、验证、测试清晰组织。每个病例的JSON清单文件记录了图像路径、掩膜路径、质心文件及椎体标签列表(含26个椎体名称字符串),可轻松集成到现有深度学习框架中。特别地,该数据集与EasyMedSeg工具包中的VerSe预处理函数完全兼容,无需额外修改代码即可复用数据处理流程。对于那些希望快速可视化预览的用户,数据集中还提供了Parquet格式的中间切片预览(包含切片图像、分割掩膜和叠加效果),便于在不加载完整三维容积的前提下进行初步探索与调试。推荐的评估指标包括Dice相似系数、表面距离度量等,可遵循挑战赛官方协议进行公平比较。
背景与挑战
背景概述
VERSE20(Vertebrae Segmentation Challenge 2020)是由慕尼黑工业大学、哈佛医学院等多家机构的研究者于2020年MICCAI挑战赛中发布的大规模三维CT脊柱分割基准数据集。该数据集涵盖286名受试者、303个CT体积扫描,包含从颈椎C1至腰椎L6的完整脊柱区域,并经过专家手动校正的逐椎骨分割掩膜。核心研究问题聚焦于多探测器CT图像中的椎骨自动标注与分割,旨在推动脊柱影像分析领域的算法标准化与性能评估。作为VerSe项目的延续,VERSE20不仅为医学图像分割社区提供了丰富的数据资源,还通过统一评测协议促进了跨机构方法的横向比较,对脊柱疾病诊断、手术规划及生物力学建模等方向产生了深远影响。
当前挑战
VERSE20面临的挑战首先源于脊柱解剖结构的复杂性——椎骨形态在颈椎、胸椎和腰椎间差异显著,且存在过渡椎体(如T13、L6)等罕见变异,极大增加了分割网络的泛化难度。其次,数据集采用多厂商、多探测器CT设备采集,导致图像噪声、分辨率及伪影模式差异明显,对算法的鲁棒性提出严苛要求。在构建过程中,专家需要从海量临床扫描中精准标注4142个椎骨,手工校正耗时费力且易受主观判读影响,而确保跨中心标注一致性更是巨大工程。此外,部分受试者拥有多个扫描序列(如矢状位、轴向),数据的异构性进一步考验模型对空间位置与解剖先验知识的融合能力,使得精确分割与定位成为当前技术瓶颈。
常用场景
经典使用场景
VERSE20数据集专为脊柱CT影像中椎骨的三维分割与标记任务而设计,是医学影像分析领域一项精雕细琢的基准资源。其经典使用场景聚焦于从多探测器CT扫描中,对颈椎、胸椎及腰椎的每一块椎骨进行精确的体素级分割和单独编号。研究人员利用该数据集训练深度学习模型,以自动识别并勾勒出从C1至L6的二十余块椎骨轮廓,从而验证算法在处理解剖结构变异、多中心数据来源及不同扫描协议时的鲁棒性与泛化能力。
实际应用
在实际临床场景中,VERSE20数据集赋能的模型可应用于脊柱疾病诊断与手术规划的诸多环节。例如,在椎体压缩性骨折的自动筛查中,精准的分割结果能够辅助放射科医生定位受损椎体并量化其塌陷程度;在脊柱侧弯矫形手术前,三维重建的椎骨模型为医生提供关键的空间位置信息,从而优化螺钉植入路径。此外,这些技术还逐步融入骨科风险评分系统和术后随访评估流程,切实提升了诊疗效率与精度。
衍生相关工作
基于VERSE20数据集,衍生出多项具有广泛影响力的经典工作。例如,SegThor挑战赛中的蒙特利尔大学团队提出了多任务学习框架,同时解决椎骨分割与中心点定位问题;而U-Net及其变体(如nnU-Net)在该数据集上的卓越表现,则催生了面向医学影像分割的自适应架构设计理论。此外,该数据集还支撑了诸如变形Transformer及空间注意力机制等前沿方法的验证,并作为域适应和半监督学习研究的核心基准,持续推动着医学影像分析领域的技术迭代与创新浪潮。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作