SELMA3D
收藏arXiv2025-01-07 更新2025-01-09 收录
下载链接:
https://selma3d.grand-challenge.org
下载链接
链接失效反馈官方服务:
资源简介:
SELMA3D数据集由慕尼黑亥姆霍兹中心环境健康研究中心等机构创建,旨在推动3D光片显微镜图像分割的自监督学习研究。该数据集包含35个大尺寸3D图像,每个图像包含超过1000^3体素,以及315个标注的小块图像,用于模型微调和测试。数据集涵盖了多种生物结构,如血管样和斑点样结构。数据来源于小鼠和人类大脑的光片显微镜图像,经过染色和组织透明化处理。数据集的应用领域包括神经科学、免疫学、肿瘤学和心脏病学,旨在解决3D显微镜图像分割中的领域转移问题,提升模型的泛化能力。
The SELMA3D dataset was developed by institutions including the Helmholtz Zentrum München - German Research Center for Environmental Health, with the goal of advancing self-supervised learning research for 3D light-sheet microscopy image segmentation. It contains 35 large-scale 3D images, each with over 1000³ voxels, as well as 315 annotated image patches for model fine-tuning and testing. The dataset covers a variety of biological structures such as vessel-like and spot-like structures. The data is derived from light-sheet microscopy images of mouse and human brains, which have undergone staining and tissue clearing treatments. Its application domains include neuroscience, immunology, oncology, and cardiology, and it is designed to address the domain shift problem in 3D microscopy image segmentation and improve the generalization ability of models.
提供机构:
慕尼黑亥姆霍兹中心环境健康研究中心, 慕尼黑大学, 慕尼黑工业大学, 帝国理工学院, 康奈尔大学, 苏黎世大学, 上海财经大学, BGI研究院, 浙江大学, 多伦多大学, 名古屋大学
创建时间:
2025-01-07
搜集汇总
数据集介绍

构建方式
SELMA3D数据集的构建基于光片显微镜(LSM)技术,结合组织透明化方法,实现了对小鼠和人类大脑的高分辨率三维成像。数据采集过程包括组织染色、透明化和LSM成像三个标准化步骤。染色过程使用了多种特异性染料,如小麦胚芽凝集素(WGA)和伊文思蓝(EB)用于血管可视化,c-Fos染色用于神经元活动相关的细胞,TO-PRO-3染色用于细胞核,刚果红染色用于淀粉样蛋白斑块。组织透明化方法采用了3DISCO技术。LSM成像通过UltraMicroscope II或原型UltraMicroscope进行,确保了图像的高对比度和分辨率。数据注释通过虚拟现实(VR)技术进行三维可视化,并由多位专家进行分层注释和验证,确保了注释的准确性和一致性。
使用方法
SELMA3D数据集的使用方法主要围绕自监督学习和模型微调展开。首先,研究人员可以利用未注释的大规模三维图像进行自监督学习预训练,通过设计预训练任务(如对比学习、掩码体积修复等)提取通用的特征表示。随后,使用带有注释的图像块对预训练模型进行微调,以适应特定的分割任务。数据集分为训练集、初步测试集和最终测试集,分别用于模型预训练、初步评估和最终评估。评估指标包括Dice相似系数、Betti数误差和中心线Dice相似系数,分别用于评估斑点样结构和树状管状结构的分割效果。通过这种方式,SELMA3D数据集为开发具有泛化能力的三维显微镜图像分割模型提供了强有力的支持。
背景与挑战
背景概述
SELMA3D数据集由德国慕尼黑亥姆霍兹环境健康研究中心组织,旨在推动自监督学习在3D光片显微镜图像分割领域的应用。该数据集创建于2024年,主要研究人员包括Ying Chen和Johannes C. Paetzold等。SELMA3D挑战赛在MICCAI 2024会议上首次举办,提供了来自小鼠和人类大脑的35个大型3D光片显微镜图像,每个图像包含超过1000^3个体素,以及315个标注的小块图像用于微调和测试。该数据集涵盖了多种生物结构,如血管样和斑点样结构,旨在通过自监督学习提升分割模型的泛化能力。SELMA3D的推出填补了3D显微镜图像自监督学习领域的空白,推动了相关研究的发展。
当前挑战
SELMA3D数据集面临的挑战主要集中在两个方面。首先,3D光片显微镜图像分割任务本身具有极高的复杂性,尤其是在处理大规模体素数据时,如何高效且准确地分割出复杂的生物结构是一个关键问题。其次,自监督学习模型的构建过程中,如何从无标注数据中提取有效的特征表示,并在不同生物结构之间实现泛化,是另一个重要挑战。尽管自监督学习在自然图像处理中取得了显著进展,但在3D显微镜图像领域的应用仍处于探索阶段,模型的泛化能力和鲁棒性仍需进一步提升。此外,数据集的构建过程中,如何确保标注的准确性和一致性,尤其是在处理高分辨率3D图像时,也是一个技术难点。
常用场景
经典使用场景
SELMA3D数据集在3D光片显微镜图像分割领域具有广泛的应用,尤其是在自监督学习框架下。该数据集通过提供大量未标注的3D光片显微镜图像,以及少量标注的补丁,支持研究人员开发能够在不同生物结构上具有良好泛化能力的分割模型。经典的使用场景包括对小鼠和人类大脑中的血管、细胞核、c-Fos+细胞等结构的自动分割,这些任务在神经科学、免疫学和肿瘤学等领域具有重要意义。
解决学术问题
SELMA3D数据集解决了传统深度学习模型在3D光片显微镜图像分割中的泛化能力不足问题。传统模型依赖于大量标注数据,且对领域变化敏感,导致在未见过数据上表现不佳。通过自监督学习,SELMA3D数据集使模型能够从未标注数据中学习通用特征,从而在少量标注数据上进行微调后,显著提升模型的分割性能和泛化能力。这一突破为生物医学图像分析提供了新的研究范式。
实际应用
在实际应用中,SELMA3D数据集被广泛用于生物医学研究中的3D图像分析。例如,在神经科学研究中,该数据集支持对大脑血管网络的精确分割,帮助研究人员理解血管在疾病中的作用。在肿瘤学中,SELMA3D数据集可用于分析癌细胞的三维分布,为癌症转移研究提供重要数据支持。此外,该数据集还被用于开发自动化工具,加速生物样本的大规模分析。
数据集最近研究
最新研究方向
近年来,随着光片显微镜技术的快速发展,结合组织透明化技术,研究者能够以细胞分辨率对大型哺乳动物组织进行三维成像。这一进展与深度学习驱动的大规模数据分析相结合,极大地推动了生物样本形态和功能特性的研究。然而,现有的深度学习分割模型在面对训练数据分布之外的数据时,往往表现出显著的性能下降。为解决这一问题,SELMA3D挑战赛在MICCAI 2024会议上提出了一种基于自监督学习的三维光片显微镜图像分割方法。该数据集包含来自小鼠和人类大脑的35个大型三维图像,每个图像包含超过1000^3个体素,以及315个用于微调和测试的标注小样本。研究结果表明,自监督学习在大规模数据集上的应用显著提升了分割模型的性能和泛化能力,尤其是在面对未见过的生物结构时。这一研究为三维显微镜图像分割领域提供了新的思路,推动了自监督学习在生物医学图像分析中的应用。
相关研究论文
- 1SELMA3D challenge: Self-supervised learning for 3D light-sheet microscopy image segmentation慕尼黑亥姆霍兹中心环境健康研究中心, 慕尼黑大学, 慕尼黑工业大学, 帝国理工学院, 康奈尔大学, 苏黎世大学, 上海财经大学, BGI研究院, 浙江大学, 多伦多大学, 名古屋大学 · 2025年
以上内容由遇见数据集搜集并总结生成



