VerSe 2020
收藏arXiv2021-03-11 更新2024-06-21 收录
下载链接:
https://osf.io/t98fz/
下载链接
链接失效反馈官方服务:
资源简介:
VerSe 2020数据集是由慕尼黑工业大学医学院诊断与介入神经放射学系创建,包含300个受试者的4142个完全可视化和标注的脊椎CT图像,涵盖了多种解剖变异和来自四个不同制造商的扫描仪数据。数据集通过人机混合算法生成,包括脊椎标记信息、体素级分割掩码和解剖评级,旨在支持开发和基准测试鲁棒且准确的分割算法。该数据集的应用领域包括自动化脊椎形态和病理分析,旨在解决现有训练数据集中解剖变异不足的问题。
VerSe 2020 Dataset was developed by the Department of Diagnostic and Interventional Neuroradiology, School of Medicine, Technical University of Munich. It comprises 4,142 fully visualized and annotated spinal CT images from 300 subjects, covering a broad spectrum of anatomical variations and scanner data from four different manufacturers. Generated via a hybrid human-machine algorithm, the dataset includes spinal landmark annotations, voxel-level segmentation masks, and anatomical grading information, with the goal of supporting the development and benchmarking of robust and accurate segmentation algorithms. Its application domains cover automated spinal morphological and pathological analysis, and it is designed to address the issue of insufficient anatomical variations in existing training datasets.
提供机构:
慕尼黑工业大学医学院诊断与介入神经放射学系
创建时间:
2021-03-11
搜集汇总
数据集介绍

构建方式
VerSe 2020数据集的构建旨在解决脊柱影像分析中深度学习算法的泛化问题。该数据集由来自四个不同扫描仪制造商的300名受试者的脊柱CT图像组成,包含4142个完全可视化和注释的椎骨。数据集的构建过程包括多中心数据收集、半自动分割算法的应用以及人工校正。首先,使用深度学习框架对椎骨进行标记和分割,然后通过手动校正过程提高分割精度。最终,由神经放射科医生审核和批准分割结果,确保数据集的准确性和可靠性。
特点
VerSe 2020数据集的特点在于其多样性、全面性和质量。首先,数据集包含了来自不同扫描仪制造商的多中心数据,有助于提高算法的泛化能力。其次,数据集包含多种解剖变异,如数字异常和过渡椎骨,这些在常规训练数据集中较少出现,有助于算法在临床场景中的表现。此外,数据集的分割质量高,所有椎骨均经过详细标注和校正,为算法训练和评估提供了可靠的基础。最后,数据集以公开的形式提供,促进了脊柱影像分析领域的研究和发展。
使用方法
使用VerSe 2020数据集进行脊柱影像分析研究时,首先需要了解数据集的结构和文件格式。数据集包含319个CT图像序列,每个序列均以NIfTI格式存储。分割掩码也以NIfTI格式保存,而所有4142个分割椎骨的标签则以JSON格式提供。数据集被分为训练集、公共测试集和私有测试集,以方便研究人员进行算法训练和评估。使用时,可以根据研究需求选择合适的子集,并结合相应的分割算法进行椎骨标记和分割。此外,数据集还提供了一些辅助代码和工具,如数据读取、写入和评估脚本,以帮助研究人员更好地利用数据集。
背景与挑战
背景概述
在医学影像领域,特别是脊柱成像方面,深度学习算法的兴起使得全自动化的影像分析成为可能。针对脊柱成像中的椎体分割任务,已经提出了多种基于深度学习的方法,包括卷积神经网络(CNN)、图卷积网络(GCN)和点云分析(PC)。这些方法在分析骨骼结构方面显示出巨大潜力,能够自动检测椎体骨折并测量骨密度。然而,这些方法很大程度上依赖于数据,需要大量的数据集和相应的元数据来开发和验证模型。为了解决这一数据依赖问题,VerSe 2019数据集被发布,为社区提供了大量的、精确标注的脊柱CT影像数据。在此基础上,VerSe 2020数据集应运而生,其规模和多样性都有显著提升,旨在为脊柱成像的计算机辅助诊断(CADx)算法提供更可靠、更准确的基础。
当前挑战
VerSe 2020数据集面临着多个挑战。首先,虽然数据集已经包括了大量的脊柱CT影像,但仍可能缺乏某些非常罕见的变异。其次,尽管数据集包括了不同制造商的扫描数据,但可能仍然无法完全代表临床环境中的所有扫描仪。此外,数据集中未包含与骶骨部分融合的腰椎椎体,这可能会限制其泛化能力。未来工作可能需要解决脊柱的完整分割,包括骶骨,以及纳入更多的病理变化,如转移和创伤性骨折。这些挑战需要通过不断更新数据集和改进算法来解决。
常用场景
经典使用场景
在脊柱影像学领域,VerSe 2020数据集被广泛用于训练和评估深度学习算法在椎骨分割任务上的性能。该数据集包含了来自300名受试者的4142个椎骨的注释CT图像,覆盖了多种解剖变异和来自四个不同扫描仪制造商的数据。这使得VerSe 2020成为开发鲁棒且准确分割算法的理想选择,这些算法能够识别和解剖学上复杂的脊柱结构,以及罕见的解剖变异,如椎骨数量异常和过渡椎骨。
解决学术问题
VerSe 2020数据集解决了脊柱影像学中深度学习算法训练和评估的挑战。由于大多数现有的训练数据集缺乏解剖学变异和来自不同扫描仪制造商的数据,因此,它们在处理临床实践中遇到的罕见情况时效果不佳。VerSe 2020通过提供大量包含解剖学变异和不同扫描仪数据的数据集,为解决这一问题提供了宝贵的资源。此外,该数据集还提供了精确的椎骨分割标签,这对于开发能够准确识别和解剖学上复杂的脊柱结构的算法至关重要。
衍生相关工作
VerSe 2020数据集的发布促进了脊柱影像学领域的研究和创新。基于该数据集,研究人员开发了多种先进的椎骨分割算法,这些算法在处理临床实践中遇到的罕见情况时表现出色。此外,VerSe 2020还推动了脊柱影像学领域中计算机辅助诊断(CAD)的发展,这些技术可以帮助放射科医生更快速、更准确地诊断脊柱疾病。VerSe 2020数据集的发布为脊柱影像学领域的研究和创新提供了宝贵的资源,并推动了该领域的发展。
以上内容由遇见数据集搜集并总结生成



