five

Angelou0516/NIS3D

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/NIS3D
下载链接
链接失效反馈
官方服务:
资源简介:
NIS3D是一个用于胚胎组织荧光显微镜图像的密集3D细胞核分割基准数据集。它提供了6个大体积3D图像(斑马鱼、果蝇、小鼠),包含22,000多个经过三位独立标注者验证的手动标注细胞,并附有基于标注者一致性的每个细胞的置信度分数。数据集以3D荧光显微镜(体积TIFF堆栈)为模态,目标为细胞核(实例分割),物种包括斑马鱼、果蝇和小鼠。数据集文件格式为多页TIFF(`.tif`),可在Fiji/ImageJ或`tifffile`中打开。数据集发布在NeurIPS 2023(数据集和基准赛道),并采用CC-BY-4.0许可。

NIS3D is a dense 3D nuclei segmentation benchmark for fluorescence microscopy of embryonic tissue. It provides 6 large-volume 3D images (Zebrafish, Drosophila, Mus Musculus) with over 22,000 manually annotated cells vetted by three independent annotators, accompanied by per-cell confidence scores derived from inter-annotator agreement. The dataset modality is 3D fluorescence microscopy (volumetric TIFF stacks), targeting cell nuclei (instance segmentation) across species including Zebrafish, Drosophila, and Mus Musculus (mouse). The file format is multi-page TIFF (`.tif`), openable with Fiji/ImageJ or `tifffile`. Published at NeurIPS 2023 (Datasets and Benchmarks Track) under CC-BY-4.0 license.
提供机构:
Angelou0516
搜集汇总
数据集介绍
main_image_url
构建方式
NIS3D数据集的构建始于对斑马鱼、果蝇和小鼠三种模式生物胚胎组织的大体积三维荧光显微成像。研究者采集了6个高质量的多页TIFF堆栈,覆盖不同发育阶段与细胞密度。在标注阶段,22,000余个细胞核由三名独立标注者逐一手动分割,并通过两两比对生成共识标签图。标注分歧被编码为逐体素的置信度分数(1至4级),其中1表示边界模糊、无法可靠标注的区域。最终数据集包含原始荧光体积、共识实例标签、置信度图以及元数据文件,确保了标注的高质量与可复现性。
特点
该数据集的核心特色在于其密集的三维细胞核实例标注与逐细胞置信度评估机制。所有样本均为完整的原生组织体积,而非二维切片或稀疏标注,这为验证三维分割算法的体素级精度提供了坚实基础。置信度分数不仅反映了标签的不确定性,更在评估时指导研究者忽略边界模糊区域,从而避免对算法的不公平惩罚。此外,数据集覆盖多物种、多显微镜类型与多种分辨率,增强了模型的泛化能力测试。作为NeurIPS 2023收录的基准,NIS3D在密集三维分割领域具有标杆意义。
使用方法
用户可通过Zenodo或HuggingFace直接下载NIS3D的原始TIFF堆栈与标注文件。每个样本文件夹内的GroundTruth.tif为推荐的共识实例标签,配合ConfidenceScore.tif进行评估——预测落在置信度1的体素应被忽略(既不计为真阳性也不计为假阳性)。数据集提供了跨图像与图像内两种建议划分方案,但研究者亦可自定义训练测试集。在Python中,推荐使用tifffile或imageio加载数据,而后基于各体素的三维邻域特性设计分割网络,并利用实例分割指标(如Dice、AJI)进行模型评测。
背景与挑战
背景概述
在发育生物学与生物医学成像领域,精确的三维细胞核实例分割是解析胚胎组织形态发生与细胞命运决定的关键前提。然而,受限于显微成像技术的分辨率和组织样本的高密度特性,现有数据集普遍面临标注规模小、跨物种泛化能力不足等问题。由弗吉尼亚理工大学Yu实验室联合多家机构于2023年在NeurIPS数据集与基准轨道上发布的NIS3D基准,正是针对上述困境的里程碑式贡献。该数据集提供了6张跨斑马鱼、果蝇和家鼠三个模式生物的大体积三维荧光显微图像,包含超过22,000个经三重人工标注校验的细胞核,并创新性地引入标注者间一致性导出的置信度评分。NIS3D不仅填补了密集三维细胞核分割领域缺乏全面标注基准的空白,更通过标准化的评估流程和开源协议(CC-BY-4.0),为计算病理学与发育生物学的交叉研究树立了新的评测标杆。
当前挑战
NIS3D所应对的领域挑战集中于高密度三维细胞核分割中普遍存在的边界模糊性与标注歧义问题。在胚胎组织中,细胞核紧密堆积且荧光信号可能重叠,导致传统自动分割方法难以区分相邻实例。据此,该数据集明确要求模型在评估时忽略置信度为1的体素(即边界区域),以公平量化分割精度。在构建层面,挑战同样显著:22,000多个细胞核的密集三维标注依赖三名独立标注者的逐层协作,并通过三向一致性投票生成最终共识标签;为兼顾标注质量与规模,团队开发了从原始TIFF堆栈到置信度图的完整处理管线,并设计了跨图像与图像内两种数据划分方案,以支持鲁棒性验证。这些措施共同确保了NIS3D在克服标注噪声的同时,为密集实例分割算法的开发与比较提供了高置信度的基准资源。
常用场景
经典使用场景
在计算生物学与医学影像分析的交汇领域,NIS3D作为首个针对致密三维细胞核图像的全注释基准数据集,其经典使用场景聚焦于胚胎组织荧光显微图像的实例分割任务。该数据集包含斑马鱼、果蝇及小鼠三个物种的六大幅三维体积图像,提供了超过两万两千个经三位独立标注者交叉验证的细胞核注释,并创新性地引入了基于标注一致性的逐细胞置信度评分机制。研究者可据此训练和评估深度学习模型在三维空间中精确分离彼此粘连、形态各异的细胞核的能力,尤其适用于探索如何在高密度细胞环境中区分模糊边界与噪声干扰,从而推动从原始成像数据到可靠生物学定量分析的跨越。
实际应用
在生命科学和医学研究的实际应用中,NIS3D数据集所驱动的三维细胞核分割技术直接赋能于胚胎发育机制解析、药物筛选毒性评估以及疾病模型构建等场景。精准的细胞核实例分割是对细胞数量、位置、体积及分裂状态进行定量分析的前提,对于理解器官形成过程中细胞增殖与凋亡的时空规律至关重要。研究人员可借助在该数据集上训练的模型,自动化处理从共聚焦或光片显微镜获取的海量三维图像,大幅提升从高通量实验中提取生物学信号的效率,减少手动标注所需的人力成本,最终推动发育生物学、神经科学及再生医学领域对细胞动态行为的大规模量化研究。
衍生相关工作
NIS3D数据集自发布以来,已催生了一系列紧密相关的经典工作,尤其是在三维医学影像分割领域。这些衍生研究包括基于Transformer架构的三维细胞核分割网络,以及融合多尺度特征与注意力机制以提升致密细胞边界分辨率的创新方法。部分工作聚焦于利用该数据集的置信度标签设计新的损失函数,使得模型能够学习忽略标注不确定区域,从而提升分割结果的鲁棒性。此外,还有研究探讨了跨物种迁移学习策略,验证了在NIS3D上预训练的模型对未经见的胚胎图像以及小鼠脑组织等完全不同成像模态的泛化潜力,促进了生物图像分析中更通用的分割基础模型的构建。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作