five

SPIDER - Lumbar spine segmentation in MR images|医学影像数据集|图像分割数据集

收藏
arXiv2024-03-05 更新2024-06-21 收录
医学影像
图像分割
下载链接:
https://doi.org/10.5281/zenodo.10159290
下载链接
链接失效反馈
资源简介:
SPIDER数据集是由荷兰拉德布德大学医学中心等机构共同创建的大型多中心腰椎MRI数据集,包含447个矢状T1和T2 MRI系列,来源于218名有下背痛历史的患者。数据集通过迭代数据标注方法,利用自动分割算法进行半自动分割,随后进行人工审核和修正,以提高分割精度。该数据集不仅包含椎体、椎间盘和脊髓管的分割,还提供了放射学分级信息,适用于自动图像分析算法的开发和评估,旨在提高MRI在下背痛诊断中的应用价值。
提供机构:
诊断影像分析组,拉德布德大学医学中心,尼姆根,荷兰
创建时间:
2023-06-21
AI搜集汇总
数据集介绍
main_image_url
构建方式
SPIDER数据集的构建采用了多中心合作的方式,汇集了来自四个不同医院的447个腰椎磁共振成像(MRI)系列,涵盖218名患有下腰痛的患者。数据集包括了T1和T2加权MRI图像,以及高分辨率的T2 SPACE序列。通过迭代数据标注方法,首先手动标注部分数据,然后利用训练好的分割算法进行半自动分割,最终通过人工校正和再训练,逐步完成整个数据集的标注。这种方法不仅提高了标注效率,还确保了数据的高质量。
特点
SPIDER数据集的显著特点在于其多中心、多序列的特性,涵盖了腰椎的多个解剖结构,包括椎骨、椎间盘和脊髓管。数据集不仅提供了详细的解剖结构分割,还包含了每个椎间盘水平的放射学分级,有助于识别健康和病变的病例。此外,数据集还提供了两种基准算法的性能指标,为算法开发者提供了参考和比较的依据。
使用方法
SPIDER数据集适用于开发和评估腰椎MRI图像的自动分割算法。用户可以通过公开的基准算法(如迭代实例分割算法和nnU-Net)进行性能比较,并参与在Grand Challenge平台上举办的持续分割挑战。数据集的详细信息和使用指南可在其官方网站上找到,用户需遵循CC-BY 4.0许可协议进行数据的使用和分享。
背景与挑战
背景概述
SPIDER数据集,由Jasper W. van der Graaf等人于2024年创建,专注于腰椎磁共振成像(MRI)中的脊柱分割。该数据集由Radboud大学医学中心等多个机构合作开发,旨在解决腰椎MRI图像中相关解剖结构的自动分割问题。数据集包含447个来自218名患者的矢状位T1和T2 MRI序列,涵盖了椎骨、椎间盘和脊髓管的参考分割。SPIDER数据集的推出填补了腰椎MRI领域高质量公开数据集的空白,为机器学习和人工智能算法的发展提供了宝贵的资源,有望提升腰椎MRI的诊断价值。
当前挑战
SPIDER数据集在构建过程中面临多项挑战。首先,腰椎MRI图像的分割任务复杂,涉及多个解剖结构的精确标注,尤其是椎骨的棘突和椎间盘的环状结构。其次,数据集的多中心来源导致图像质量和分辨率存在差异,增加了算法训练的难度。此外,数据集的标注过程采用了迭代方法,通过半自动分割和手动校正相结合,这种方法虽然提高了效率,但也可能引入偏差。最后,数据集的公开挑战旨在公平比较不同分割算法,但如何确保测试集的独立性和评估的公正性仍是一个挑战。
常用场景
经典使用场景
SPIDER数据集在腰椎磁共振图像(MRI)分割领域中具有经典应用场景,主要用于训练和验证自动分割算法。通过提供包含447个T1和T2 MRI序列的多中心数据集,SPIDER支持对椎骨、椎间盘和脊髓管的精确分割。这种分割任务对于低背痛患者的诊断和治疗规划至关重要,尤其是在需要量化和客观评估脊柱结构的情况下。
解决学术问题
SPIDER数据集解决了腰椎MRI图像分割中的多个学术研究问题。首先,它填补了多中心、高质量腰椎MRI数据集的空白,为机器学习和人工智能算法提供了丰富的训练数据。其次,通过提供参考分割和性能基准,SPIDER促进了算法开发和评估的标准化,有助于推动脊柱图像分析领域的研究进展。此外,数据集中的放射学分级信息进一步增强了其研究价值,为脊柱疾病的自动诊断和预后提供了可能。
衍生相关工作
SPIDER数据集的发布催生了多项相关研究工作。首先,基于该数据集的分割算法研究显著增加,推动了脊柱图像分析技术的进步。其次,SPIDER数据集的公开挑战赛吸引了全球研究者的参与,促进了算法性能的比较和提升。此外,数据集的多中心特性为跨机构合作提供了基础,推动了脊柱疾病诊断和治疗的标准化研究。未来,SPIDER数据集有望成为脊柱影像分析领域的基准数据集,支持更多创新研究和技术应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录