SpineBench

Hugging Face2025-06-04 更新2025-06-05 收录

下载链接：

https://huggingface.co/datasets/Silversorrow/SpineBench

下载链接

链接失效反馈

官方服务：

资源简介：

SpineBench是一个针对脊椎领域的视觉问答基准数据集，包含64,878个问答对，涵盖11种脊椎疾病，用于细粒度分析和评估LVLM在脊椎疾病诊断和病变定位任务上的性能。

创建时间：

2025-05-29

搜集汇总

数据集介绍

构建方式

SpineBench作为脊柱医学领域的视觉问答基准数据集，其构建过程体现了严谨的临床医学逻辑。数据集整合了来自BUU Spine Dataset、CSXA、RSNA和VinDr-SpineXR四大权威数据源的40,263张脊柱影像，通过专业医师团队标注形成了64,878个QA对。数据标注采用双层架构，既包含11种脊柱疾病的诊断标注，又涵盖L1/L2至L5/S1五个腰椎节段的病灶定位标注。为确保数据质量，所有标注均经过临床医师的交叉验证，并采用标准化预处理流程统一了不同来源影像的格式和分辨率。

特点

该数据集最显著的特征在于其精细的临床任务划分和丰富的元数据标注。数据集不仅区分了脊柱疾病诊断和病灶定位两大核心任务，每个病例还附有患者性别、年龄等临床背景信息。影像数据覆盖了从健康样本到11种典型脊柱病变的完整谱系，其中24,615个病例具有像素级的病灶定位标注。特别值得注意的是，数据集构建时特别保留了临床诊断中常见的易混淆病例，为模型的可解释性研究提供了珍贵素材。

使用方法

研究人员可通过Hugging Face数据集库直接加载SpineBench，其标准化的JSON格式确保了易用性。每个数据样本包含影像路径、问题文本、多选选项和标准答案等结构化字段。典型使用场景包括：加载特定分割的子集进行模型训练，通过task字段筛选不同临床任务数据，或利用metadata字段进行患者群体分析。评估时建议采用官方划分的1,000例诊断任务和1,128例定位任务测试集，以确保结果可比性。

背景与挑战

背景概述

SpineBench数据集作为一项专注于脊柱医学领域的视觉问答（VQA）基准测试，由Zhang Chenghanyu等研究人员开发，旨在推动大语言视觉模型（LVLM）在脊柱疾病诊断与病灶定位任务中的精细化评估。该数据集整合了来自BUU Spine、CSXA等四大权威医学影像源的40,263张脊柱影像，涵盖11类脊柱病变类型，并构建了包含64,878个问答对的标注体系。其创新性地将临床诊断逻辑与多模态学习相结合，为智能辅助诊断系统提供了兼具解剖学特征理解与病理推理能力的评估框架，显著填补了脊柱专科医学影像分析领域的基准空白。

当前挑战

构建SpineBench面临双重核心挑战：在领域问题层面，脊柱病变的细微影像学差异（如椎间盘退变与椎体滑脱的相似征象）要求模型具备亚毫米级的特征辨别能力，而临床诊断中复合型病变的共存现象进一步增加了分类复杂度；在数据构建层面，跨机构医学影像的异构性（如不同设备的扫描协议差异）需通过严格的图像标准化预处理解决，同时确保五位资深放射科医师对病灶标注的一致性达到Kappa>0.85的医学研究标准，其标注成本与质量控制构成显著挑战。

常用场景

经典使用场景

在医学影像分析领域，SpineBench数据集作为脊柱疾病诊断的视觉问答基准，为研究人员提供了丰富的脊柱图像与标注数据。该数据集通过包含40,263张脊柱图像及64,878个问答对，覆盖11种脊柱疾病，支持视觉语言模型在脊柱疾病诊断和病灶定位任务中的性能评估。

实际应用

在实际医疗场景中，SpineBench数据集可用于开发辅助诊断系统，帮助放射科医生快速识别脊柱疾病并定位病灶。其涵盖的多种疾病类型和详细的病灶标注信息，为临床决策提供了重要参考，尤其在腰椎退行性病变的早期筛查和诊断中具有显著应用价值。

衍生相关工作

基于SpineBench数据集，研究者已开展多项经典工作，包括开发针对脊柱疾病的多模态视觉问答模型、优化病灶定位算法，以及探索模型推理过程的临床可解释性。这些工作进一步推动了医学影像分析领域的技术进步，并为脊柱疾病的智能化诊断奠定了基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集