GoodBaiBai88/M3D-Seg

Name: GoodBaiBai88/M3D-Seg
Creator: GoodBaiBai88
Published: 2024-04-24 13:54:50
License: 暂无描述

Hugging Face2024-04-24 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/GoodBaiBai88/M3D-Seg

下载链接

链接失效反馈

官方服务：

资源简介：

M3D-Seg是一个大规模通用的3D医学图像分割数据集，包含了25个公开的3D CT分割数据集，总计5,772个3D图像和149,196个3D掩码注释。该数据集不仅支持传统的语义分割任务，还支持基于文本的分割任务。数据集的格式和结构被详细描述，包括数据加载、预处理、数据分割等信息。数据集的组织方式便于统一集成更多的公开和私有数据集，从而构建更大规模的通用3D医学图像分割数据集。

提供机构：

GoodBaiBai88

原始信息汇总

数据集概述

数据集名称

名称: Large-scale General 3D Medical Image Segmentation Dataset (M3D-Seg)

数据集简介

目的: 解决3D医学图像分割中由于隐私和成本限制导致的公开可用大型3D医学图像及其标注数据稀缺问题。
组成: 整合了25个公开的3D CT分割数据集，总计5,772个3D图像和149,196个3D掩码标注。
数据格式: 图像和掩码文件存储在各自的子数据集文件夹中，每个子数据集使用JSON文件进行分割。

数据集特点

支持任务: 不仅支持传统的图像-掩码语义分割任务，还支持图像-掩码-文本形式的分割任务，如基于文本提示的分割和参考分割。
数据格式: 数据存储为npy格式，掩码信息以稀疏矩阵格式存储。

数据集结构

组织方式: 数据集按照统一的格式组织，便于整合更多公共和私有数据集。
文件结构: 每个子数据集包含多个数据文件夹，每个文件夹内包含图像和掩码文件。

数据集下载

总大小: 约224G
下载方式: 支持通过Git克隆、SDK加载和手动下载。

数据集使用

预处理: 数据集已预处理，无需再次使用data_preocess.py。
加载示例: 提供data_load_demo.py作为读取图像和掩码的示例代码。

数据集来源

来源: 包括CHAOS、HaN-Seg、AMOS22等多个公开数据集。

许可证

许可证: Apache-2.0

标签和描述

标签文本: 每个掩码对应的语义标签以文本形式存在。
描述: 使用term_dictionary.json提供每个语义标签的多重定义或描述。

支持的任务

3D分割: 语义分割、文本基础分割、参考分割等。
3D定位: 视觉基础/参考表达理解、参考表达生成。

数据分割

分割方式: 每个子数据集通过JSON文件分割为训练和测试部分。

引用信息

引用: 使用该数据集时，应引用相关文献。

搜集汇总

数据集介绍

构建方式

在三维医学影像分割领域，数据稀缺性长期制约着算法模型的泛化能力。M3D-Seg数据集通过系统整合25个公开可用的三维CT分割数据集，构建了一个大规模通用分割资源库。其构建过程涉及对CHAOS、AMOS22、TotalSegmentator等数据源的统一编码与格式转换，将原始的nii.gz文件预处理为高效的npy格式，并采用稀疏矩阵技术压缩存储掩码数据。每个子数据集均通过独立的JSON文件进行训练与测试划分，最终形成包含5,772幅三维影像与149,196个三维掩码标注的标准化集合，为多模态医学影像分析奠定了结构化数据基础。

使用方法

使用该数据集时，研究者可通过HuggingFace的load_dataset接口直接加载，或克隆仓库获取预处理后的npy格式数据。数据加载脚本data_load_demo.py提供了读取稀疏矩阵掩码的标准范例，确保正确解析带形状标识的npz文件。对于模型构建，可依据子数据集JSON文件中的划分信息组织训练与测试流程；若需进行文本驱动分割，可结合term_dictionary.json中的语义描述生成提示词。数据集已适配SegVol、M3D等先进架构，用户可通过统一的数据管道开展三维分割、视觉定位等多类任务，无需重复处理原始数据，显著提升研究效率。

背景与挑战

背景概述

三维医学图像分割是医学影像分析领域的一项核心任务，旨在从CT等三维体数据中精确描绘解剖结构或病变区域，为临床诊断与治疗规划提供关键依据。然而，由于医学数据固有的隐私性与标注成本高昂，大规模、高质量且公开可用的三维医学图像分割数据集长期匮乏，制约了深度学习模型在该领域的泛化能力与发展。为应对这一挑战，研究团队于2024年整合了25个公开的三维CT分割数据集，构建了名为M3D-Seg的大规模通用三维医学图像分割数据集。该数据集由BAAI-DCAI等机构的研究人员主导，汇集了包括CHAOS、AMOS22、TotalSegmentator等在内的多源数据，共计包含5,772幅三维图像与149,196个三维掩码标注，并创新性地引入了文本描述与语义标签的关联，旨在推动多模态大语言模型在三维医学图像分析中的应用，为通用分割模型的研究奠定了重要的数据基础。

当前挑战

在三维医学图像分割领域，模型需应对不同解剖部位、成像协议与病理表现所带来的巨大域间差异，实现精准且鲁棒的分割仍是一项艰巨挑战。M3D-Seg数据集致力于通过统一整合多源数据来缓解这一难题，但其构建过程亦面临诸多困难。首先，原始数据集在图像分辨率、对比度、标注标准与文件格式上存在显著异质性，需进行复杂的归一化与预处理以确保数据一致性。其次，为支持新兴的文本引导分割任务，需为每个语义标签生成准确且多样的文本描述，这依赖于自动化工具与人工校验的结合。此外，大规模三维数据的存储与高效访问亦构成技术瓶颈，数据集采用稀疏矩阵格式压缩掩码以节约空间，但增加了数据加载与处理的复杂性。这些挑战共同凸显了构建通用医学图像分析基准所需的技术严谨性与工程努力。

常用场景

经典使用场景

在三维医学影像分析领域，M3D-Seg数据集为通用分割任务提供了统一且标准化的数据基础。该数据集整合了25个公开的CT分割数据集，涵盖腹部、胸部、肝脏、胰腺等多个解剖部位，其经典使用场景在于训练和评估基于深度学习的通用三维医学图像分割模型。研究者可利用其丰富的图像与掩码标注，开发能够跨不同解剖结构、成像协议和疾病类型进行鲁棒分割的算法，从而推动医学影像分析从特定任务向通用智能的演进。

解决学术问题

M3D-Seg数据集有效应对了三维医学图像分割研究中长期存在的数据稀缺与异构性问题。通过大规模整合多源公开数据并进行统一预处理与编码，该数据集为学术界提供了宝贵的基准资源，使得研究者能够系统探索模型在跨数据集、跨器官泛化能力上的表现。其意义在于降低了因数据隐私与采集成本带来的研究门槛，促进了通用分割模型、少样本学习以及领域自适应等前沿方向的发展，为构建更稳健、可扩展的医学影像分析系统奠定了数据基石。

实际应用

在实际医疗场景中，M3D-Seg数据集支撑的模型可辅助临床诊断与治疗规划。其支持的传统语义分割与新兴的基于文本提示的分割任务，能够直接应用于放射科工作流，例如自动勾勒肿瘤轮廓、精确分割器官与病变区域，从而量化病灶体积、辅助手术导航与放疗靶区勾画。这种自动化工具不仅提升了诊断效率与一致性，也为个性化医疗提供了可靠的影像量化依据，具有转化为临床辅助决策系统的潜力。

数据集最近研究