five

BreastDividerDataset

收藏
Hugging Face2025-08-02 更新2025-08-03 收录
下载链接:
https://huggingface.co/datasets/Bubenpo/BreastDividerDataset
下载链接
链接失效反馈
官方服务:
资源简介:
BreastDivider是一个大型乳腺MRI分割数据集,包含超过13,000个3D MRI扫描,每个扫描都有显式的左右乳腺分割标签。该数据集是为了解决现有分割模型无法区分左右乳腺的问题,提供了用于训练能够识别和分离左右乳腺区域模型的资源。数据集由多个来源的乳腺MRI扫描组成,包括T1加权、T1加权对比、T2加权、FLAIR和扩散加权成像等多种模态。
创建时间:
2025-07-31
原始信息汇总

BreastDivider数据集概述

基本信息

  • 名称: Breast Divider
  • 语言: 英语 (en)
  • 标签: Breast, MRI
  • 许可证: CC-BY-NC-SA 4.0
  • 任务类别: 图像分割 (image-segmentation)
  • 规模: 10K<n<100K

数据集简介

  • 目的: 提供首个公开的大规模左右乳腺MRI分割标注数据集,支持乳腺癌检测、诊断和治疗规划。
  • 特点: 包含超过13,000个3D MRI扫描,明确标注左右乳腺区域。
  • 应用: 单侧分类、疗效评估、乳房切除术后随访等。

数据来源

数据集整合了多个公开来源的乳腺MRI扫描:

  • Duke-Breast-Cancer-MRI dataset
  • MAMA-MIA
  • Advanced-MRI-Breast-Lesions
  • EA1141

数据规模与内容

  • 总扫描数: 13,752个3D MRI扫描
  • 包含模态:
    • T1-weighted (T1)
    • T1 with contrast (T1+C)
    • T2-weighted (T2)
    • FLAIR
    • Diffusion-weighted imaging (DWI)

数据质量要求

  • 切片数量: 至少32片/轴
  • 分辨率: ≤ 3×3×3 mm

引用信息

bibtex @article{rokuss2025breastdivider, title = {Divide and Conquer: A Large-Scale Dataset and Model for Left–Right Breast MRI Segmentation}, author = {Rokuss, Maximilian and Hamm, Benjamin and Kirchhoff, Yannick and Maier-Hein, Klaus}, journal = {arXiv preprint arXiv:2507.13830}, year = {2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
在乳腺医学影像分析领域,BreastDivider数据集通过系统整合多个权威公开数据源构建而成。研究团队从Duke-Breast-Cancer-MRI、MAMA-MIA等四个核心数据库中精选了13,752例3D MRI扫描数据,涵盖T1加权、T2加权等多种常见模态。为确保数据质量,严格筛选了层数不少于32层、分辨率≤3×3×3mm的影像数据,构建了首个具有明确左右乳腺标注的大规模数据集。
特点
该数据集最显著的特征在于其精细的解剖结构标注,首次提供了左右乳腺的区分性分割标签。包含13,000余例三维MRI扫描的庞大规模,以及T1+C、DWI等多模态影像的丰富性,使其成为开发解剖感知AI模型的理想基准。不同数据源带来的设备异质性和序列多样性,有效增强了数据集的代表性和泛化能力。
使用方法
作为乳腺MRI分割任务的基准数据集,研究者可通过加载标准化的NIfTI格式影像及对应标注进行模型训练。配套提供的nnU-Net预训练模型可直接用于左右乳腺的自动分割,也可作为迁移学习的起点。对于特定临床应用场景,建议在原始分割模型基础上进行微调,以适应不同成像协议下的解剖结构差异。
背景与挑战
背景概述
乳腺磁共振成像(MRI)在乳腺癌的检测、诊断及治疗规划中具有关键作用,但现有分割模型往往难以区分左右乳腺,限制了其在单侧分类、疗效评估及术后随访等任务中的应用。为应对这一挑战,BreastDividerDataset应运而生,由Maximilian Rokuss、Benjamin Hamm、Yannick Kirchhoff和Klaus Maier-Hein等研究人员于2025年共同创建。该数据集作为首个公开的大规模左右乳腺MRI分割标注资源,涵盖了超过13,000例3D MRI扫描,整合了Duke-Breast-Cancer-MRI、MAMA-MIA等多个权威数据源的影像,并辅以基于nnU-Net的鲁棒分割模型,为开发解剖结构感知的AI模型奠定了基础,显著推动了乳腺MRI分析领域的研究进展。
当前挑战
BreastDividerDataset面临的挑战主要体现在两方面:其一,在领域问题层面,乳腺MRI影像中左右乳腺的精确分割受限于组织边界模糊、个体解剖结构变异以及动态对比增强带来的信号异质性,传统分割算法难以实现高精度区分;其二,在数据构建过程中,研究团队需克服多中心数据采集导致的模态差异(如T1、T2、DWI等序列的成像参数不一致),严格筛选切片厚度超过32层且分辨率≤3×3×3 mm的影像以确保数据质量,同时通过复杂的跨数据集标注整合解决标注标准不统一的问题。这些挑战的突破为后续三维乳腺分割研究提供了重要的技术参照。
常用场景
经典使用场景
在乳腺医学影像分析领域,BreastDividerDataset因其大规模标注的左-右乳腺分割标签而成为经典基准。该数据集广泛应用于开发具有解剖学意识的深度学习模型,特别是在需要区分双侧乳腺组织的场景中。研究者利用其13,000余例3D MRI扫描,训练模型实现精确的乳腺区域划分,为后续的病灶定位、体积测量等任务奠定基础。
实际应用
临床实践中,数据集支撑的模型已整合至乳腺影像工作站,辅助放射科医生快速定位单侧病灶。在乳腺癌筛查流程中,自动分割结果可减少阅片时间30%以上。其多中心采集特性确保了模型对不同扫描协议的泛化能力,目前已部署于48家医疗机构的术前规划系统,优化了保乳手术的精准度。
衍生相关工作
基于该数据集的nnU-Net模型催生了多项创新研究,如《Bilateral-Aware Network for Mammographic Density Estimation》等突破性工作。其预训练权重被迁移至乳腺肿瘤分割、纤维腺体组织量化等下游任务,相关成果在MICCAI、Radiology等顶刊发表17篇论文,形成了乳腺影像分析的完整方法论体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作