five

UCSF-BMSR MRI Dataset|医学影像数据集|脑转移瘤数据集

收藏
arXiv2024-02-06 更新2024-06-21 收录
医学影像
脑转移瘤
下载链接:
https://imagingdatasets.ucsf.edu/dataset/1
下载链接
链接失效反馈
资源简介:
UCSF-BMSR MRI数据集是由加州大学旧金山分校创建的公开临床多模态脑部MRI数据集,包含560个来自412名患者的脑部MRI图像,其中专家标注了5136个脑转移瘤。数据集包括注册和颅骨剥离的T1后对比、T1前对比、FLAIR和减影(T1前对比-T1后对比)图像,以及增强脑转移瘤的体素级分割,格式为NifTI。此外,还包括患者人口统计、手术状态和原发癌类型。该数据集旨在推动脑转移瘤AI应用的研究,特别是在小转移瘤的检测方面。
提供机构:
加州大学旧金山分校
创建时间:
2023-04-15
AI搜集汇总
数据集介绍
main_image_url
构建方式
UCSF-BMSR MRI Dataset的构建基于加利福尼亚大学旧金山分校(UCSF)医学中心进行的立体定向放射外科手术计划。该数据集包含了560个多模态脑部MRI图像,来源于412名接受伽玛刀放射外科手术的患者。数据收集过程严格遵守相关指南和法规,并获得了UCSF机构审查委员会的批准。MRI图像通过回顾性搜索机构放射学档案获取,排除了无增强性脑转移、仅硬脑膜或软脑膜转移以及数据缺失或损坏的病例。图像包括T1增强后、T1增强前、FLAIR和减影(T1增强前-T1增强后)序列,并进行了颅骨剥离处理。脑转移的体素级分割由两名神经放射学研究员或两名主治神经放射学家使用ITK-SNAP软件完成,确保了高精度的标注。
特点
UCSF-BMSR MRI Dataset的显著特点在于其多模态MRI图像的丰富性和高质量的专家标注。数据集包含了5136个脑转移的体素级分割,覆盖了多种原发癌症类型,如肺癌、乳腺癌和黑色素瘤。此外,数据集还提供了患者的临床信息,包括手术状态和原发癌症类型,增强了数据集的临床相关性。图像的预处理步骤包括从DICOM格式转换为NifTI格式、T1和FLAIR图像的刚性配准以及颅骨剥离,确保了数据的标准化和可用性。
使用方法
UCSF-BMSR MRI Dataset主要用于推动脑转移检测和分割的AI应用研究。研究者可以使用该数据集训练和验证深度学习模型,如nnU-Net,以提高脑转移的自动检测和分割性能。数据集的公开使用遵循非商业许可,部分训练集数据已公开下载,测试集数据将在2024年MICCAI挑战赛结束后公开。研究者可以通过访问https://imagingdatasets.ucsf.edu/dataset/1获取数据,并通过https://github.com/rachitsaluja/UCSF-BMSR-benchmarks获取相关代码和预训练网络。
背景与挑战
背景概述
UCSF-BMSR MRI Dataset,由加州大学旧金山分校(UCSF)的脑转移瘤立体定向放射外科(BMSR)团队创建,是一个公开的临床多模态脑MRI数据集。该数据集包含来自412名患者的560个脑MRI图像,专家标注了5136个脑转移瘤。数据集包括注册和去颅骨的T1对比后、T1对比前、FLAIR和减影(T1对比前-T1对比后)图像,以及增强脑转移瘤的体素级分割,格式为NifTI。此外,数据集还包含患者的人口统计学信息、手术状态和原发癌症类型。UCSF-BMSR数据集的公开旨在推动人工智能在脑转移瘤检测中的应用。
当前挑战
UCSF-BMSR MRI Dataset在构建过程中面临多项挑战。首先,检测非常小的转移瘤是一个主要难题,这需要高精度的图像处理和分析技术。其次,数据集的构建涉及大量的图像注册和去颅骨处理,这些步骤需要精确且耗时。此外,专家标注的准确性和一致性也是一个挑战,尤其是在涉及多个标注者时。最后,尽管数据集包含多种模态的图像,但不同模态图像的整合和利用仍需进一步优化,以提高检测和分割的性能。
常用场景
经典使用场景
UCSF-BMSR MRI Dataset的经典使用场景主要集中在脑转移瘤的自动检测与分割。该数据集包含了560个多模态脑部MRI图像,以及专家标注的5136个脑转移瘤。通过这些数据,研究人员可以训练和验证深度学习模型,如nnU-Net,以实现对脑转移瘤的高精度检测和分割。这种应用不仅有助于提高诊断的准确性,还能为临床医生提供更精确的治疗规划。
解决学术问题
UCSF-BMSR MRI Dataset解决了脑转移瘤检测中的一个关键学术问题,即小尺寸转移瘤的自动识别。由于脑转移瘤的尺寸通常较小且分布广泛,传统方法难以有效检测。该数据集通过提供高分辨率的MRI图像和详细的专家标注,为研究者提供了一个理想的平台,以开发和验证能够准确检测和分割小尺寸脑转移瘤的算法。这不仅推动了神经影像学领域的发展,也为临床实践提供了有力的支持。
衍生相关工作
UCSF-BMSR MRI Dataset的发布催生了一系列相关的经典工作。例如,基于该数据集,研究者们开发了多种深度学习模型,如nnU-Net,用于脑转移瘤的自动分割。此外,该数据集还被用于多个国际挑战赛,如ASNR-MICCAI BraTS挑战赛,进一步推动了脑转移瘤检测算法的发展。这些工作不仅提升了算法的性能,也为脑转移瘤的临床诊断和治疗提供了新的工具和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

EdNet

圣诞老人收集的各种学生活动的大规模分层数据集,一个配备人工智能辅导系统的多平台自学解决方案。 EdNet 包含 2 年多来收集的 784,309 名学生的 131,441,538 次互动,这是迄今为止向公众发布的 ITS 数据集中最大的。资料来源:EdNet:教育中的大规模分层数据集

OpenDataLab 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录