five

CytoDArk0|脑细胞研究数据集|神经疾病数据集

收藏
arXiv2024-09-06 更新2024-09-10 收录
脑细胞研究
神经疾病
下载链接:
https://zenodo.org/records/13694738
下载链接
链接失效反馈
资源简介:
CytoDArk0是由伦敦南岸大学团队创建的一个用于脑细胞实例分割和分类的新型数据集,主要包含Nissl染色的大脑皮质、小脑和海马体的图像。该数据集涵盖了来自鲸偶蹄目和灵长目动物的样本,旨在支持脑细胞结构研究的自动化和可重复性。数据集的创建过程包括初始的机器学习方法和逐步的深度学习方法,最终通过CISCA框架进行处理。CytoDArk0的应用领域包括神经退行性疾病和神经炎症疾病的研究,旨在通过精确量化脑细胞的类型、密度和空间排列,揭示疾病的发病机制和治疗方法。
提供机构:
伦敦南岸大学
创建时间:
2024-09-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
CytoDArk0数据集的构建基于Nissl染色技术,涵盖了哺乳动物大脑的多个区域,包括大脑皮层、小脑和海马体等,涉及鲸偶蹄目和灵长目等多个物种。数据集由69张20倍放大率的1024×1024像素图像和58张40倍放大率的2048×2048像素图像组成。这些图像通过QuPath软件进行手动标注,标注内容包括神经元和胶质细胞的轮廓。为了确保数据集的质量,标注过程经过多次校验和修正,最终生成了实例分割掩码以及辅助地图,如轮廓掩码和距离地图,以支持后续的深度学习模型训练和评估。
特点
CytoDArk0数据集的显著特点在于其专注于Nissl染色的脑组织图像,提供了高分辨率的细胞实例分割标注。与传统的H&E染色相比,Nissl染色能够更清晰地展示细胞体的形态和密度,尤其适用于脑细胞的结构分析。此外,数据集涵盖了多个物种和脑区,提供了丰富的细胞形态和密度变化,为跨物种的脑细胞结构比较研究提供了宝贵的资源。
使用方法
CytoDArk0数据集可用于训练和评估细胞实例分割和分类的深度学习模型。用户可以通过加载数据集中的图像和标注,使用轻量级的U-Net架构进行模型训练,结合像素分类和距离回归任务来实现细胞的精确分割。数据集的标注信息包括细胞的轮廓和类型,支持多任务学习,如细胞实例分割和分类。此外,数据集的开放性使得研究人员能够在此基础上进行进一步的算法开发和验证,推动数字神经病理学和脑细胞结构研究的发展。
背景与挑战
背景概述
CytoDArk0数据集由伦敦南岸大学、帕多瓦大学和帕多瓦统计科学研究所的研究团队于2024年9月9日创建,旨在支持脑细胞实例分割与分类的研究。该数据集包含Nissl染色的大脑组织图像,涵盖了哺乳动物的皮质、小脑和海马体等多个脑区。CytoDArk0的创建是为了填补脑组织Nissl染色图像中细胞实例分割数据集的空白,推动数字病理学和脑细胞结构研究的发展。该数据集的发布不仅为深度学习方法在脑细胞分割与分类中的应用提供了基础,还为神经退行性疾病和神经炎症等领域的研究提供了新的工具。
当前挑战
CytoDArk0数据集在构建过程中面临了多个挑战。首先,细胞实例分割任务本身具有复杂性,尤其是在细胞重叠、接触或形态多样的情况下,准确分割和分类细胞极具挑战性。其次,Nissl染色图像中的细胞形态和密度变化较大,不同脑区和物种之间的细胞特征差异显著,这增加了模型训练的难度。此外,构建过程中需要大量的人工标注,以确保数据集的质量和准确性,这一过程耗时且容易受到标注者主观性的影响。最后,数据集的多样性和复杂性要求模型具备较强的泛化能力,能够在不同放大倍数和染色技术下保持稳定的性能。
常用场景
经典使用场景
CytoDArk0数据集的经典使用场景主要集中在脑组织细胞的实例分割与分类任务中。该数据集提供了Nissl染色的大脑组织图像,涵盖了皮质、小脑和海马体等多个脑区,适用于研究大脑细胞的形态学特征、密度分布以及细胞类型的分类。通过结合深度学习框架CISCA,研究者可以实现对单个细胞的精确分割与分类,进而支持大脑皮层结构、神经元分布等领域的研究。
衍生相关工作
CytoDArk0数据集的发布催生了一系列相关的经典工作,尤其是在脑组织细胞分割与分类领域。例如,基于该数据集,研究者开发了CISCA框架,提出了一种轻量级的U-Net架构,结合多任务学习实现了高效的细胞实例分割与分类。此外,该数据集还推动了其他深度学习方法的发展,如StarDist、Hover-Net等,这些方法在细胞分割与分类任务中表现出色,进一步扩展了CytoDArk0的应用范围。未来,该数据集有望在脑细胞图谱构建、神经网络分析等领域发挥更大的作用。
数据集最近研究
最新研究方向
CytoDArk0数据集的最新研究方向主要集中在深度学习框架在细胞实例分割与分类中的应用,特别是在组织病理学图像分析和脑皮层细胞结构研究中的前沿应用。研究者提出了一种名为CISCA的新型深度学习框架,该框架通过轻量级的U-Net架构,结合多任务学习方法,实现了细胞实例的精确分割与分类。此外,CytoDArk0数据集的引入为脑皮层细胞结构研究提供了新的开放资源,推动了数字病理学和脑细胞结构研究的进展。该数据集的发布不仅促进了跨物种脑细胞结构比较研究,还为神经退行性疾病和神经炎症性疾病的病理机制研究提供了新的工具。
相关研究论文
  • 1
    CISCA and CytoDArk0: a Cell Instance Segmentation and Classification method for histo(patho)logical image Analyses and a new, open, Nissl-stained dataset for brain cytoarchitecture studies伦敦南岸大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

TPTP

TPTP(Thousands of Problems for Theorem Provers)是一个包含大量逻辑问题的数据集,主要用于定理证明器的测试和评估。它包含了多种逻辑形式的问题,如一阶逻辑、高阶逻辑、命题逻辑等。

www.tptp.org 收录

OECD - Education at a Glance

该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。

www.oecd.org 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

EmoBench-M

EmoBench-M是由深圳大学计算机科学与软件工程学院等机构创建的一个新型基准数据集,旨在评估大型多模态语言模型在情感智能方面的能力。该数据集基于心理学的情感理论,包含13个评估场景,涵盖了基础情感识别、对话情感理解和复杂社会情感分析三个维度。数据集采用视频、音频和文本等多模态数据,为评估大型多模态语言模型在真实世界交互中的情感智能提供了全面的基准。

arXiv 收录