five

agucci/mri-sym2|医学影像数据集|脑部MRI数据集

收藏
hugging_face2024-02-11 更新2024-03-04 收录
医学影像
脑部MRI
下载链接:
https://hf-mirror.com/datasets/agucci/mri-sym2
下载链接
链接失效反馈
资源简介:
SymBrain是一个用于脑部MRI图像对称性检测和分割的标注数据集。该数据集包含来自dHCP数据集的T1w和T2w脑部MRI扫描图像,每个图像都标注了理想的中矢状面(MSP),用于将大脑分为两个对称的半球。数据集分为训练集和测试集,分别包含1476和1674张图像。数据集的创建过程包括从1050个3D体积中提取三个切片,生成3150张图像,并使用V7lab工具进行手动标注。数据集的特征包括图像、直线标注坐标、放射学评分和会话ID。该数据集的使用可以促进脑部MRI图像分割方法的创新,并有助于医学诊断和治疗计划的进步。
提供机构:
agucci
原始信息汇总

数据集卡片 for mri-sym2

数据集概述

SymBrain是一个注释的脑部MRI图像数据集,旨在推动脑部对称性检测和分割领域的发展。该数据集包含来自dHCP数据集的多种脑部MRI T1w和T2w扫描图像,每个图像都标注了理想的直线中矢状平面(MSP),将大脑分为两个对称半球。准确提取MSP有望大大提高分割精度。

研究人员和从业者可以利用此数据集设计创新方法,以提高脑部MRI图像分割的精度。SymBrain丰富的内容使研究社区能够解决神经影像分析中的复杂挑战,最终有助于医学诊断和治疗计划的进步。

对称性分析在医学图像处理中起着重要作用,特别是在疾病和畸形的检测中。SymBrain利用脑部MRI图像中观察到的固有双侧对称性,使其成为开发和评估自动算法的重要资源,这些算法旨在检测脑部MRI数据中的对称轴。

数据集结构

数据集包含1476张T1w图像和1674张T2w图像。不同模态之间的差异在于不同脑区强度的变化。所有图像都可以在数据集的train部分访问。

数据集创建

加载数据

数据集包含1476行的train分割,包含t1类型图像,以及1674行的test分割,包含t2类型图像。

python dataset = load_dataset("agucci/mri-sym2")

第一个数据集示例选择:

dataset[train][0]

属性:

  • image: PIL图像,形状为(290, 290)
  • line: 图像上的直线标注坐标({x:x1, y:y1}, {x:x2, y:y2})。其中(x1,y1)和(x2,y2)是线的起点和终点。
  • rad_score: 图像提取自的体积的放射学评分。请参考dHCP文档了解评分解释。
  • session: 原始数据集的会话ID,用于扫描检索。

源数据

来自dHCP数据集。从每个1050个3D体积中提取了三个切片,创建了3150张图像。

标注

作者使用V7lab工具手动进行了标注。

许可信息

MIT

引用信息

使用数据时请引用:

bibtext @misc{gucciardi2024symbrain, title={Symbrain: A large-scale dataset of MRI images for neonatal brain symmetry analysis}, author={Arnaud Gucciardi and Safouane El Ghazouali and Francesca Venturini and Vida Groznik and Umberto Michelucci}, year={2024}, eprint={2401.11814}, archivePrefix={arXiv}, primaryClass={cs.CV} }

以及

dhcp数据集 数据由发展中的人类连接组项目提供,KCL-Imperial-Oxford联盟由欧洲研究委员会根据欧盟第七框架计划(FP/2007-2013)/ERC资助

AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建agucci/mri-sym2数据集时,研究者从dHCP数据集中提取了1050个3D体积,每个体积中提取了三张切片,共计3150张图像。这些图像包括T1w和T2w两种类型,分别用于训练和测试集。数据集的标注工作通过V7lab工具手动完成,确保了每张图像中理想的中矢状平面(MSP)的精确标注。这种精细的标注方法旨在提升脑部MRI图像分割的准确性,为后续的医学影像分析提供高质量的数据支持。
特点
agucci/mri-sym2数据集的显著特点在于其丰富的内容和高质量的标注。该数据集不仅包含了1476张T1w和1674张T2w的MRI图像,还提供了每张图像中理想的中矢状平面(MSP)的标注信息。此外,每张图像还附带了放射学评分和扫描会话ID,这些元数据为研究者提供了额外的分析维度。数据集的多样性和详细标注使其成为脑部对称性检测和分割研究的宝贵资源。
使用方法
使用agucci/mri-sym2数据集时,研究者可以通过加载数据集并选择相应的分割(如训练集或测试集)来访问图像和标注信息。每张图像包含一个PIL格式的图像对象、直线标注的坐标、放射学评分以及扫描会话ID。研究者可以利用这些信息进行脑部MRI图像的分割和对称性分析。此外,数据集的MIT许可证允许广泛的使用和分发,促进了其在学术和工业界的应用。
背景与挑战
背景概述
SymBrain数据集,由Arnaud Gucciardi等人于2024年创建,旨在推动脑部MRI图像对称性检测与分割领域的发展。该数据集基于dHCP项目中的T1w和T2w MRI扫描图像,通过手动标注理想的中矢状平面(MSP),将大脑划分为两个对称半球。SymBrain不仅为研究人员提供了丰富的脑部MRI图像资源,还通过精确的MSP提取,显著提升了图像分割的精度。该数据集的发布,标志着脑部对称性分析在医学图像处理中的重要性,为自动化算法的发展提供了宝贵的资源,进一步推动了医学诊断和治疗规划的进步。
当前挑战
SymBrain数据集在构建过程中面临多项挑战。首先,手动标注MSP需要高度的专业知识和精确度,以确保标注的准确性和一致性。其次,数据集的多样性要求算法能够处理不同模态(T1w和T2w)的图像,这增加了模型训练的复杂性。此外,数据集的规模和质量对算法的性能有直接影响,如何在有限的资源下高效地处理和分析大量数据,是研究人员需要解决的关键问题。最后,数据集的发布和使用需遵循严格的伦理和法律规范,确保患者隐私和数据安全。
常用场景
经典使用场景
在神经影像学领域,agucci/mri-sym2数据集的经典使用场景主要集中在脑部MRI图像的对称性检测与分割。该数据集通过提供大量标注的脑部MRI T1w和T2w扫描图像,帮助研究人员开发和优化自动算法,以精确识别和分割脑部的中间矢状面(MSP)。这种精确的分割不仅提升了图像处理的准确性,还为后续的疾病检测和治疗规划提供了坚实的基础。
解决学术问题
agucci/mri-sym2数据集在学术研究中解决了脑部MRI图像对称性检测的关键问题。通过提供高质量的标注数据,该数据集显著提升了对称性分析的准确性和可靠性,从而推动了神经影像学领域的技术进步。此外,该数据集还为研究者提供了丰富的资源,用于开发和验证新的算法,进一步促进了医学影像分析技术的发展。
衍生相关工作
agucci/mri-sym2数据集的发布催生了一系列相关研究工作。例如,基于该数据集的算法优化和模型训练,研究者们开发了多种用于脑部MRI图像自动分割和对称性检测的工具。这些工具不仅在学术界得到了广泛应用,还在临床实践中展示了其巨大的潜力。此外,该数据集还激发了更多关于脑部影像数据处理和分析的研究,推动了整个领域的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录