RationAI/MoNuSAC
收藏Hugging Face2025-04-21 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/RationAI/MoNuSAC
下载链接
链接失效反馈官方服务:
资源简介:
MoNuSAC数据集是一个包含来自肺、前列腺、肾脏和乳腺四个不同器官的图像数据集,图像尺寸在100到2000像素之间,拍摄于40倍放大倍数。数据集提供了四种细胞核类型的注释,包括模糊不清的细胞核区域。数据集分为训练集和测试集,其中训练集包含209个图像块和31411个注释细胞核,测试集包含101个图像块和15498个注释细胞核。
The MoNuSAC dataset is a collection of images from four different organs: Lung, Prostate, Kidney, and Breast. The images range in size from 100 to 2000 pixels and are captured at 40x magnification. The dataset provides annotations for four types of cell nuclei, including ambiguous regions. It is divided into a training set and a test set, with the training set containing 209 image patches and 31,411 annotated nuclei, and the test set containing 101 image patches and 15,498 annotated nuclei.
提供机构:
RationAI
搜集汇总
数据集介绍

构建方式
MoNuSAC数据集的构建旨在为医学图像分割领域提供一个多器官细胞核分割与分类的基准。该数据集通过收集四个不同器官——肺、前列腺、肾脏和乳腺的图像,并对这些图像中的细胞核进行详细标注,从而构建而成。图像尺寸从100到2000像素不等,均为40倍放大拍摄。数据集包括训练集和测试集,其中训练集包含209个图像块和来自46名患者的31,411个标注细胞核,测试集则包含101个图像块和来自25名患者的15,498个标注细胞核。
特点
MoNuSAC数据集的特点在于其跨多个器官的细胞核标注,提供了四种细胞核类型的分类标签,包括模糊不清的细胞核区域。数据集的结构分为训练集和测试集,每个集合中的图像均以表格格式存储,包括患者ID、RGB图像块、细胞核实例列表和对应的类别标签。此外,每个样本还标注了其来源的器官类型。这些特点使得该数据集成为医学图像分析领域中一个重要且实用的资源。
使用方法
使用MoNuSAC数据集时,用户可以直接利用其提供的训练集和测试集进行模型训练和性能评估。数据集以HuggingFace的格式组织,支持通过HuggingFace的库直接加载和预处理。用户需遵循数据集的许可协议,并在论文引用中注明数据集来源。针对具体任务,如细胞核分割和分类,研究者可以利用该数据集进行深度学习模型的开发、训练和验证,以推进医学图像分析技术的发展。
背景与挑战
背景概述
MoNuSAC数据集,全称为Multi-Organ Nuclei Segmentation and Classification,是由多个研究机构和专家合作创建的医学图像分析领域的数据集。该数据集成立于2020年,旨在为多器官细胞核分割与分类提供标准化的研究平台。主要研究人员包括Ruchika Verma、Neeraj Kumar等,核心研究问题聚焦于医学图像中细胞核的精确分割与分类,对计算病理学领域具有显著影响。MoNuSAC数据集包含了来自四种不同器官(肺、前列腺、肾脏、乳房)的图像,提供了四种类型细胞核的注释,为相关研究提供了宝贵的数据资源。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:确保数据标注的准确性和一致性,以及处理不同器官和组织类型间的差异性。研究领域面临的挑战则包括如何在复杂多变的医学图像中实现高精度的细胞核分割与分类,以及如何利用这些数据开发出具有普遍适用性的算法模型。此外,数据集的多样性和规模也为算法的泛化能力和计算效率提出了更高的要求。
常用场景
经典使用场景
MoNuSAC数据集在医学图像分析领域,尤其是细胞核分割任务中,被广泛用作训练和评估模型的基础。该数据集提供了多器官来源的图像,并标注了四种类型的细胞核,使得研究者可以在此之上开展细胞核分类与分割的研究。
衍生相关工作
基于MoNuSAC数据集,研究者们衍生出了一系列相关工作,包括但不限于改进的细胞核分割算法、多任务学习框架以及跨器官的迁移学习研究,这些工作进一步扩展了该数据集的应用范围和影响力。
数据集最近研究
最新研究方向
在医学图像分析领域,MoNuSAC数据集以其多器官来源的细胞核分割与分类特性,成为研究的热点。近期研究主要聚焦于利用深度学习技术提升细胞核检测的准确性和效率,特别是在处理模糊边界和分类不确定性方面。该数据集的应用不仅推动了计算病理学的发展,也为精确医疗提供了重要的技术支持。
以上内容由遇见数据集搜集并总结生成



