flwrlabs/fed-brats
收藏Hugging Face2026-05-06 更新2026-05-10 收录
下载链接:
https://hf-mirror.com/datasets/flwrlabs/fed-brats
下载链接
链接失效反馈官方服务:
资源简介:
Fed-BraTS是一个从Spirit-26/BraTS-2024-Complete数据集的BraTS-GLI部分导出的Hugging Face数据集。它包含用于肿瘤分割的多参数脑部MRI病例,具有四种MRI模态、一个分割掩码、站点元数据以及一个PNG预览图像,方便在Hugging Face数据集查看器中检查。该数据集旨在支持医学图像分割实验和联邦学习工作流,其中病例可以按站点分区或跨站点采样。
Fed-BraTS is a Hugging Face dataset derived from the BraTS-GLI subset of the Spirit-26/BraTS-2024-Complete dataset. It contains multiparametric brain MRI cases for tumor segmentation, featuring four MRI modalities, a segmentation mask, site metadata, and a PNG preview image for easy inspection in the Hugging Face Dataset Viewer. This dataset is designed to support medical image segmentation experiments and federated learning workflows, where cases can be partitioned by site or sampled across sites.
提供机构:
flwrlabs
搜集汇总
数据集介绍

构建方式
Fed-BraTS数据集源自BraTS-GLI子集,经过精心筛选与处理,旨在为医学影像分割与联邦学习研究提供标准化数据支持。构建流程包括从源数据集中提取符合训练条件的病例,逐一验证每例是否包含四种MRI模态(T1加权、增强T1加权、T2加权、T2-FLAIR)及对应的分割掩膜。随后,依据站点信息进行分层划分,对每站病例随机排序并以固定种子采样,约20%的病例划归内部测试集,余者作为训练集。病例的NIfTI体积文件被复制至专属目录,同时从增强T1加权序列中抽取中间轴向切片生成PNG预览图像。最终,将各模态的文件路径、预览图像及站点元数据整合为Parquet表格,确保Hub预览的稳定性与原始影像的可访问性。
特点
该数据集的核心特色在于其兼顾医学影像完整性与联邦学习场景的适配性。每条记录对应一位BraTS受试者,涵盖五种成像通道的NIfTI文件路径及一张嵌入的二维预览图,既保留了三维体积的全部分辨率信息,又通过轻量级预览图提升了数据集查看器的直观性。站点元数据的显式存储使得研究人员能基于‘Site’字段灵活构建客户端分区,模拟真实场景中的非独立同分布数据分布,为联邦学习算法验证提供天然基准。此外,数据集采用Parquet格式存储元数据,支持高效批量读取,与Hugging Face生态无缝集成,显著降低了多模态MRI数据在联邦学习工作流中的使用门槛。
使用方法
使用者可通过Hugging Face的datasets库一键加载数据集,获得包含训练与测试两分组的DatasetDict对象。模态与掩膜列存储为仓库内相对路径字符串,如需加载完整三维体积,可结合nibabel库与本地仓库路径进行解析。对于联邦学习实验,推荐借助Flower Datasets库的NaturalIdPartitioner,直接以‘Site’字段为划分依据生成客户端分区,实现跨站点的非中心化训练。数据集的使用需严格遵守原始BraTS许可条款,仅限于科研目的,不得用于临床诊断或治疗决策。基准模型训练时,建议直接引用BraTS原始论文及Flower框架文献,以维护学术贡献的透明性。
背景与挑战
背景概述
脑肿瘤的精确分割在神经肿瘤学中至关重要,而多模态MRI数据的集成分析已成为提升分割准确性的关键途径。Fed-BraTS数据集由flwrlabs团队基于BraTS-GLI子集构建,于2024年发布,旨在为脑肿瘤分割的联邦学习研究提供标准化数据基础。该数据集涵盖了T1加权、对比增强T1加权、T2加权及FLAIR四种模态的MRI体积数据,并包含对应的分割掩膜与采集站点元信息。作为Brain Tumor Segmentation (BraTS)挑战系列的最新衍生成果,Fed-BraTS直接服务于跨机构协作场景下的多模态分割模型训练与验证,推动了医学影像分析在隐私保护范式下的发展。
当前挑战
Fed-BraTS所面临的挑战主要聚焦于领域问题与数据集构建两个层面。在领域问题中,脑肿瘤分割任务需处理高异质性病变形态与多站点成像差异带来的泛化难题,同时联邦学习框架要求模型在无需汇聚原始数据的前提下,从分散的站点数据中学习鲁棒特征表示。在数据构建层面,原始NIfTI格式的体积文件因体量庞大无法直接被Hugging Face数据集查看器解码,研究团队通过将文件路径存储于表格,并嵌入二维切片预览图的方式予以解决。此外,数据集严格按采集站点进行分层划分,每站点约20%的病例被设置为内部验证集,以确保联邦实验中站点间分区的自然性与可复现性。
常用场景
经典使用场景
Fed-BraTS数据集专注于多参数磁共振成像(MRI)中的脑肿瘤分割任务,尤其适用于需要同时利用四种MRI模态(T1、T1ce、T2、T2-FLAIR)和对应分割掩膜的深度学习模型训练与评估。研究者可以将其作为基准数据集,验证和比较U-Net、Transformer或混合架构等分割模型在脑胶质瘤病灶区域识别上的性能。该数据集还特别为联邦学习场景设计,通过内置的站点元数据,支持以真实医疗机构为划分依据的非独立同分布(non-IID)数据分区实验,是跨中心协作训练与隐私保护模型验证的绝佳平台。
实际应用
在实际应用层面,Fed-BraTS所支持的联邦学习框架可被部署到多家医院或研究机构的本地系统中,实现脑肿瘤分割模型的协同训练而不泄露患者隐私。临床环境中,基于该数据集训练的模型能够辅助放射科医生在术前自动勾勒肿瘤区域,为手术规划和疗效评估提供定量参考。此外,站点级分区能力使医院能够根据自身数据分布定制模型,并参与全局模型的聚合更新,进而提升罕见亚型或小众设备成像条件下的分割准确率。这种去中心化的协作模式在医疗数据共享受限的当下具有极高的实用价值。
衍生相关工作
围绕Fed-BraTS数据集的特性,学界已衍生出一系列重要研究工作。在联邦学习领域,研究者基于其站点划分机制,提出了多种应对非IID数据分布的聚合算法(如FedProx、SCAFFOLD)以及动态客户端选择策略,有效缓解了站点间数据偏移引发的模型收敛问题。在医学影像分割方面,该数据集被用于改进U-Net家族架构中的注意力机制与多模态融合模块,催生了如nnU-Net的自适应预处理方法和TransBTS等混合架构。此外,基于该数据的域泛化和域适应研究也为模型在不同成像协议间的迁移学习奠定了坚实的实验基础。
以上内容由遇见数据集搜集并总结生成



