CytoDArk0

Name: CytoDArk0
Creator: 伦敦南岸大学
Published: 2024-09-06 18:34:06
License: 暂无描述

arXiv2024-09-06 更新2024-09-10 收录

下载链接：

https://zenodo.org/records/13694738

下载链接

链接失效反馈

官方服务：

资源简介：

CytoDArk0是由伦敦南岸大学团队创建的一个用于脑细胞实例分割和分类的新型数据集，主要包含Nissl染色的大脑皮质、小脑和海马体的图像。该数据集涵盖了来自鲸偶蹄目和灵长目动物的样本，旨在支持脑细胞结构研究的自动化和可重复性。数据集的创建过程包括初始的机器学习方法和逐步的深度学习方法，最终通过CISCA框架进行处理。CytoDArk0的应用领域包括神经退行性疾病和神经炎症疾病的研究，旨在通过精确量化脑细胞的类型、密度和空间排列，揭示疾病的发病机制和治疗方法。

CytoDArk0 is a novel dataset developed by the team at London South Bank University for instance segmentation and classification of brain cells. It mainly comprises Nissl-stained images of the cerebral cortex, cerebellum and hippocampus. The dataset encompasses samples from cetartiodactyls and primates, with the goal of supporting automation and reproducibility in brain cell structure research. The creation of this dataset involved initial machine learning approaches and incremental deep learning methods, and was ultimately processed using the CISCA framework. Applications of CytoDArk0 cover research into neurodegenerative and neuroinflammatory diseases, where it aims to reveal disease pathogenesis and therapeutic strategies via precise quantification of brain cell types, density and spatial organization.

提供机构：

伦敦南岸大学

创建时间：

2024-09-06

搜集汇总

数据集介绍

构建方式

CytoDArk0数据集的构建基于Nissl染色技术，涵盖了哺乳动物大脑的多个区域，包括大脑皮层、小脑和海马体等，涉及鲸偶蹄目和灵长目等多个物种。数据集由69张20倍放大率的1024×1024像素图像和58张40倍放大率的2048×2048像素图像组成。这些图像通过QuPath软件进行手动标注，标注内容包括神经元和胶质细胞的轮廓。为了确保数据集的质量，标注过程经过多次校验和修正，最终生成了实例分割掩码以及辅助地图，如轮廓掩码和距离地图，以支持后续的深度学习模型训练和评估。

特点

CytoDArk0数据集的显著特点在于其专注于Nissl染色的脑组织图像，提供了高分辨率的细胞实例分割标注。与传统的H&E染色相比，Nissl染色能够更清晰地展示细胞体的形态和密度，尤其适用于脑细胞的结构分析。此外，数据集涵盖了多个物种和脑区，提供了丰富的细胞形态和密度变化，为跨物种的脑细胞结构比较研究提供了宝贵的资源。

使用方法

CytoDArk0数据集可用于训练和评估细胞实例分割和分类的深度学习模型。用户可以通过加载数据集中的图像和标注，使用轻量级的U-Net架构进行模型训练，结合像素分类和距离回归任务来实现细胞的精确分割。数据集的标注信息包括细胞的轮廓和类型，支持多任务学习，如细胞实例分割和分类。此外，数据集的开放性使得研究人员能够在此基础上进行进一步的算法开发和验证，推动数字神经病理学和脑细胞结构研究的发展。

背景与挑战

背景概述

CytoDArk0数据集由伦敦南岸大学、帕多瓦大学和帕多瓦统计科学研究所的研究团队于2024年9月9日创建，旨在支持脑细胞实例分割与分类的研究。该数据集包含Nissl染色的大脑组织图像，涵盖了哺乳动物的皮质、小脑和海马体等多个脑区。CytoDArk0的创建是为了填补脑组织Nissl染色图像中细胞实例分割数据集的空白，推动数字病理学和脑细胞结构研究的发展。该数据集的发布不仅为深度学习方法在脑细胞分割与分类中的应用提供了基础，还为神经退行性疾病和神经炎症等领域的研究提供了新的工具。

当前挑战

CytoDArk0数据集在构建过程中面临了多个挑战。首先，细胞实例分割任务本身具有复杂性，尤其是在细胞重叠、接触或形态多样的情况下，准确分割和分类细胞极具挑战性。其次，Nissl染色图像中的细胞形态和密度变化较大，不同脑区和物种之间的细胞特征差异显著，这增加了模型训练的难度。此外，构建过程中需要大量的人工标注，以确保数据集的质量和准确性，这一过程耗时且容易受到标注者主观性的影响。最后，数据集的多样性和复杂性要求模型具备较强的泛化能力，能够在不同放大倍数和染色技术下保持稳定的性能。

常用场景

经典使用场景

CytoDArk0数据集的经典使用场景主要集中在脑组织细胞的实例分割与分类任务中。该数据集提供了Nissl染色的大脑组织图像，涵盖了皮质、小脑和海马体等多个脑区，适用于研究大脑细胞的形态学特征、密度分布以及细胞类型的分类。通过结合深度学习框架CISCA，研究者可以实现对单个细胞的精确分割与分类，进而支持大脑皮层结构、神经元分布等领域的研究。

衍生相关工作

CytoDArk0数据集的发布催生了一系列相关的经典工作，尤其是在脑组织细胞分割与分类领域。例如，基于该数据集，研究者开发了CISCA框架，提出了一种轻量级的U-Net架构，结合多任务学习实现了高效的细胞实例分割与分类。此外，该数据集还推动了其他深度学习方法的发展，如StarDist、Hover-Net等，这些方法在细胞分割与分类任务中表现出色，进一步扩展了CytoDArk0的应用范围。未来，该数据集有望在脑细胞图谱构建、神经网络分析等领域发挥更大的作用。

数据集最近研究