five

BreastDivider

收藏
arXiv2025-07-18 更新2025-08-15 收录
下载链接:
https://huggingface.co/datasets/Bubenpo/BreastDividerDataset
下载链接
链接失效反馈
官方服务:
资源简介:
BreastDivider数据集是由德国癌症研究中心创建的,包含超过13,000个标注的3D MRI体积,是迄今为止最大的分割数据集之一。该数据集汇集了来自多个公开来源的MRI扫描,所有扫描都已被标准化为一致的RAS方向,并转换为NIfTI格式。该数据集旨在解决现有算法在分割左右乳房时存在的不足,支持下游任务,如肿瘤检测和分类。

The BreastDivider Dataset was created by the German Cancer Research Center, containing over 13,000 annotated 3D MRI volumes, making it one of the largest segmentation datasets to date. This dataset compiles MRI scans from multiple public sources, with all scans standardized to a consistent RAS orientation and converted to the NIfTI format. It aims to address the shortcomings of existing algorithms for left and right breast segmentation, and supports downstream tasks such as tumor detection and classification.
提供机构:
德国癌症研究中心(DKFZ)海德堡,医学图像计算部,德国
创建时间:
2025-07-18
搜集汇总
数据集介绍
main_image_url
构建方式
BreastDivider数据集的构建过程体现了多源数据整合与标准化处理的科学严谨性。研究团队从Duke-Breast-Cancer-MRI、MAMA-MIA等四个公开数据源中筛选13,752个符合分辨率标准的3D MRI扫描,涵盖T1加权、T2加权等多种临床常用模态。通过中心质量分割技术对初始100例全乳标注数据进行左右乳分割,采用主动学习策略迭代优化模型预测结果,并由三名专家完成全量数据的人工质检与修正,最终形成空间方向统一(RAS坐标系)且格式标准化(NIfTI)的大规模标注数据集。
特点
该数据集作为目前最大的乳腺MRI分割标注资源,其核心价值体现在三个方面:13,752例3D扫描的规模优势为模型预训练提供了充分数据支撑;明确的左右乳解剖学分割标签突破了传统全乳标注的局限性;多中心、多模态的数据来源确保了临床异质性的覆盖。特别值得注意的是,所有数据均经过严格的空间标准化处理和质量控制,DSC指标达99.08%的标注一致性为后续研究提供了可靠基准。
使用方法
研究者可通过GitHub仓库获取数据集及预训练的nnU-Net模型。数据采用NIfTI格式存储,可直接输入主流医学图像处理框架。对于分割任务,建议利用五折交叉验证方案评估模型性能;在临床应用中,左右乳标签可作为先验知识辅助肿瘤检测、不对称分析等下游任务。数据集特别适用于需要单侧乳腺分析的场景,如保乳术后评估,其标准化特性还能显著降低不同机构数据的预处理差异。
背景与挑战
背景概述
乳腺癌作为全球女性发病率和死亡率居高不下的主要病因之一,其早期诊断和治疗规划对提升患者生存率至关重要。磁共振成像(MRI)凭借其高分辨率、非侵入性等优势,已成为乳腺癌检测的重要技术手段。2025年,德国癌症研究中心(DKFZ)联合海德堡大学等机构的研究团队发布了BreastDivider数据集,这是首个公开的大规模乳腺MRI左右侧分割标注数据集,包含超过13,000例三维MRI扫描数据。该数据集通过整合Duke-Breast-Cancer-MRI、MAMA-MIA等多源公开数据,采用标准化RAS空间定向和NIfTI格式,为乳腺影像分析提供了高质量的基础资源。其核心价值在于解决了现有算法难以区分左右乳腺区域的痛点,为肿瘤检测、分类等下游任务提供了精细的解剖学参考框架。
当前挑战
乳腺MRI分割领域长期面临两个关键挑战:从技术层面看,双侧乳腺在影像中常呈现复杂解剖接触,传统算法难以准确分离对称结构,尤其在术后单侧缺失等特殊场景下泛化能力显著下降;从数据构建角度,多中心影像的异质性(如1.5T/3T场强差异、T1/T2加权序列变化)对标注一致性提出严峻考验。BreastDivider团队通过中心质量分割算法结合主动学习策略,虽有效提升了13,752例数据的标注效率,但脂肪组织与腺体边界的模糊性、动态增强扫描的时相差异仍导致约5%案例需要人工修正。这些挑战凸显了医学影像分割在精度与泛化性之间的平衡难题。
常用场景
经典使用场景
在乳腺癌影像分析领域,BreastDivider数据集通过提供大规模、高精度的左右乳腺分割标签,为研究者提供了经典的使用场景。该数据集特别适用于动态对比增强MRI(DCE-MRI)分析,其中精确的乳腺分割能够作为空间先验信息,显著提升后续时间序列图像的分割效率和一致性。此外,数据集还支持单侧乳腺异常检测和乳腺不对称性研究,为临床诊断提供了可靠的数据基础。
衍生相关工作
BreastDivider数据集衍生了一系列经典工作,包括基于nnU-Net框架的高效分割模型和主动学习策略的应用。这些工作进一步推动了乳腺影像分析领域的发展,例如在弱监督学习、多模态融合和病灶定位等方面的研究。数据集还被用于验证跨序列标注迁移的可靠性,为其他医学影像分割任务提供了借鉴。
数据集最近研究
最新研究方向
在乳腺癌影像分析领域,BreastDivider数据集的推出标志着左右乳腺精确分割技术的重大突破。该数据集以其超过13,000例标注的3D MRI扫描规模,为深度学习模型在乳腺影像分析中的预训练提供了重要资源。当前研究聚焦于三个核心方向:基于nnU-Net框架的改进模型开发,旨在提升分割精度至99.1%的Dice系数以上;跨模态分割技术的探索,特别是T1加权与非对比增强序列间的标注迁移;以及该数据集在临床决策支持系统中的应用验证,如肿瘤不对称性分析和术后重建评估。这些研究不仅推动了医学图像计算的技术边界,更为乳腺癌早期诊断和个性化治疗方案的制定提供了新的量化工具。
相关研究论文
  • 1
    Divide and Conquer: A Large-Scale Dataset and Model for Left-Right Breast MRI Segmentation德国癌症研究中心(DKFZ)海德堡,医学图像计算部,德国 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作