axonet-neuromorpho-dataset
收藏Hugging Face2026-01-31 更新2026-02-02 收录
下载链接:
https://huggingface.co/datasets/broadinstitute/axonet-neuromorpho-dataset
下载链接
链接失效反馈官方服务:
资源简介:
AxoNet NeuroMorpho 数据集是一个多视角渲染的神经元形态学图像数据集,源自 NeuroMorpho.org,专为训练分割和多模态(CLIP 风格)模型而设计。数据集包含 7,158 个经过筛选的神经元,每个神经元从 24 个视角渲染,总计约 164,000 张图像。每张图像包含二值掩码(轮廓)、语义分割掩码(胞体、轴突、树突)、深度图以及丰富的元数据(物种、脑区、细胞类型、形态计量学数据)。数据集支持多种任务,包括语义分割、深度估计、对比学习和零样本分类。数据组织结构包括神经元清单、图像清单和元数据文件,每个文件包含详细的字段描述。数据集经过严格的筛选和平衡处理,确保高质量和物种平衡。适用于神经科学研究、计算机视觉和机器学习任务。数据集采用 CC-BY-4.0 许可,源数据遵循 NeuroMorpho.org 的使用条款。
The AxoNet NeuroMorpho Dataset is a multi-view rendered neuronal morphological image dataset sourced from NeuroMorpho.org, specifically designed for training segmentation and multi-modal (CLIP-style) models. The dataset comprises 7,158 curated neurons, each rendered from 24 distinct viewpoints, totaling approximately 164,000 images. Each image includes binary masks (outlines), semantic segmentation masks for somata, axons and dendrites, depth maps, and rich metadata covering species, brain regions, cell types and morphometric data. The dataset supports multiple tasks including semantic segmentation, depth estimation, contrastive learning and zero-shot classification. Its data organization structure consists of neuron lists, image lists and metadata files, with each file containing detailed field descriptions. The dataset has undergone rigorous screening and balancing to ensure high data quality and species balance, and is applicable to neuroscience research, computer vision and machine learning tasks. The dataset is licensed under CC-BY-4.0, and the original source data complies with the terms of use of NeuroMorpho.org.
创建时间:
2026-01-31
搜集汇总
数据集介绍

构建方式
在神经科学领域,高质量的数据集对于推动神经元形态学分析至关重要。AxoNet NeuroMorpho Dataset的构建始于从NeuroMorpho.org获取11,708个神经元结构数据,随后通过严格的质量控制流程筛选,包括移除下载失败、退化文件及零分叉神经元,并排除形态计量学异常值。为确保数据代表性,对过度代表的物种如小鼠和大鼠进行了数量平衡处理,最终精选出7,158个高质量神经元,每个神经元从24个视角渲染生成图像,总计约164,000张图像,涵盖二值掩码、语义分割掩码和深度图等多模态数据。
特点
该数据集以其多模态和结构化特性脱颖而出,提供了丰富的神经元形态学视觉表示。每个神经元包含24个不同视角的渲染图像,并辅以二值掩码、语义分割掩码及深度图,支持从二维投影中提取三维结构信息。数据集还整合了详细的元数据,如物种、脑区、细胞类型和形态计量学指标,增强了其在跨物种比较和生物学分析中的实用性。其物种分布经过精心平衡,覆盖小鼠、大鼠、人类等多种生物,确保了研究广度和深度。
使用方法
使用该数据集时,研究人员可通过加载JSONL格式的清单文件轻松访问数据。curated_manifest.jsonl提供神经元级别的信息,包括7,158个神经元的标识符和元数据;full_manifest.jsonl则包含图像级别的记录,约164,000条,详细描述每个视角的图像路径和相机参数。数据集支持多种机器学习任务,如语义分割、深度估计和对比学习,用户可结合相关预训练模型进行进一步分析。数据以标准化目录结构组织,便于集成到现有工作流程中,推动神经科学和计算机视觉的交叉研究。
背景与挑战
背景概述
在计算神经科学领域,神经元形态的量化分析对于理解大脑结构与功能至关重要。AxoNet NeuroMorpho数据集于2025年由Broad研究所的Giles Hall等人构建,旨在通过多视角渲染技术,将NeuroMorpho.org中公开的神经元三维形态数据转化为二维图像,以支持深度学习模型在神经元分割、深度估计及多模态对比学习等任务上的训练。该数据集精心筛选了7,158个高质量神经元,涵盖小鼠、大鼠、人类等多种物种,并提供了丰富的语义分割掩码、深度图及元数据,为神经元形态学的自动化分析提供了标准化的大规模资源,显著推动了神经影像计算模型的发展。
当前挑战
该数据集致力于解决神经元形态的自动分割与多模态表征问题,其核心挑战在于神经元结构的复杂性与多样性,如轴突与树突的精细分支在二维投影中易产生遮挡与歧义,增加了语义分割的难度。在构建过程中,研究人员需应对原始数据质量参差不齐的挑战,包括去除退化文件、零分叉神经元及形态测量异常值,并通过物种平衡策略避免模型偏差。此外,从三维SWC文件生成多视角渲染图像时,需确保视角覆盖的全面性与渲染参数的一致性,以维持数据集的可靠性与泛化能力。
常用场景
经典使用场景
在计算神经科学领域,AxoNet NeuroMorpho数据集为神经元形态学的多模态分析提供了关键资源。其经典使用场景集中于语义分割任务,通过丰富的标注信息,如二值掩码、语义分割掩码和深度图,支持对神经元结构(如胞体、轴突和树突)进行精确的像素级识别。这一过程不仅促进了自动化形态学分析的发展,还为理解神经元的三维结构在二维投影中的表现奠定了数据基础。
实际应用
在实际应用中,AxoNet NeuroMorpho数据集被广泛用于开发自动化神经影像分析工具。例如,在医学研究和脑科学实验中,它可训练深度学习模型以辅助神经元分割和分类,减少人工标注的工作量。此外,该数据集支持对比学习模型(如CLIP风格)的训练,实现基于自然语言的神经元检索,为神经信息学平台和生物数据库的智能化管理提供了技术基础。
衍生相关工作
基于该数据集,已衍生出多项经典研究工作,包括两阶段训练框架的开发。例如,broadinstitute/axonet-vae-stage1模型利用数据集的语义分割掩码进行第一阶段变分自编码器训练,专注于形态学特征提取;而broadinstitute/axonet-clip-stage2模型则在第二阶段实现文本-图像检索,拓展了多模态学习在神经科学中的应用。这些工作共同推动了神经元形态学嵌入表示的技术进步。
以上内容由遇见数据集搜集并总结生成



