five

BreastDCEDL AMBL

收藏
arXiv2025-09-30 更新2025-11-20 收录
下载链接:
https://zenodo.org/records/17189101
下载链接
链接失效反馈
官方服务:
资源简介:
BreastDCEDL AMBL数据集是从TCIA的AMBL数据集中精心挑选并转换而来的,包含88名患者共133个标记病变(89个良性,44个恶性)。该数据集的创建填补了现有公共数据集缺乏良性病变注释的空白,为良性-恶性病变分类研究提供了重要资源。数据集的内容包括患者的T1加权序列(包括一个对比前和一个对比后四个阶段)以及相应的病变分割标注。数据集创建过程包括从TCIA的AMBL数据集中选择符合条件的患者,将原始DICOM切片文件转换为3D NIfTI格式,并对分割标注进行结构化处理。BreastDCEDL AMBL数据集的应用领域是乳腺动态对比增强MRI病变分类,旨在解决现有DCE-MRI数据集缺乏良性病变注释的问题,为乳腺病变分类研究提供标准化的基准数据集。

The BreastDCEDL AMBL dataset is carefully curated and converted from the AMBL dataset hosted on The Cancer Imaging Archive (TCIA), which includes 133 annotated lesions from 88 patients (89 benign and 44 malignant). The creation of this dataset fills the gap in existing public datasets that lack annotations for benign breast lesions, providing a valuable resource for benign-malignant lesion classification research. The dataset contents include patients' T1-weighted sequences (one pre-contrast and four post-contrast phases) and corresponding lesion segmentation annotations. The dataset creation process includes selecting eligible patients from the AMBL dataset on TCIA, converting original DICOM slice files into 3D NIfTI format, and structuring the segmentation annotations. The BreastDCEDL AMBL dataset is applied to breast dynamic contrast-enhanced MRI (DCE-MRI) lesion classification, aiming to address the shortage of benign lesion annotations in existing DCE-MRI datasets and provide a standardized benchmark dataset for breast lesion classification research.
提供机构:
以色列阿里尔大学工业工程系
创建时间:
2025-09-30
搜集汇总
数据集介绍
构建方式
在乳腺动态对比增强磁共振成像领域,针对现有公共数据集缺乏良性病灶标注的局限性,BreastDCEDL AMBL通过系统化重构癌症影像档案库的AMBL集合构建而成。该数据集整合了88例患者的133个标注病灶(89个良性、44个恶性),将原始DICOM数据转换为保留信号强度的标准化3D NIfTI格式,并采用双掩模结构分别记录整体病灶与恶性肿瘤的空间分布,为良性-恶性分类研究提供了首个具备完整标注的基准数据框架。
特点
该数据集的核心价值在于其标注完整性,首次在公共领域实现了对乳腺DCE-MRI中良恶性病灶的同步空间标注。数据涵盖双侧乳腺病灶与异质性增强模式,通过RGB时序融合技术将预对比、早期及晚期增强相位映射为伪彩色图像,完整保留病灶形态学特征与动力学增强曲线。其分层抽样设计确保了训练集、验证集与测试集中良恶性病例及HER2受体状态的均衡分布,为模型泛化性能评估提供了可靠基础。
使用方法
研究者可通过Zenodo平台获取标准化的NIfTI数据与对应标注掩模,利用提供的SegFormer基准模型进行病灶级分类任务。数据处理需遵循原文描述的RGB融合流程,将三个关键时序相位分别映射至色彩通道,并通过256×256像素裁剪保留病灶中心区域。模型输出基于恶性像素占比的连续评分,建议采用0.3阈值实现零漏诊分类,同时支持患者级诊断(以最可疑病灶为判定依据)与可视化空间预测,为临床决策提供可解释依据。
背景与挑战
背景概述
乳腺磁共振成像作为癌症检测与治疗规划的关键模态,其临床应用受限于较低的特异性,导致高假阳性率与不必要活检。2025年由以色列阿里尔大学工业工程系Naomi Fridman与Anat Goldstein团队构建的BreastDCEDL AMBL数据集,通过整合癌症影像档案馆的AMBL资源,首次提供了包含88例患者133个标注病灶(89个良性、44个恶性)的标准化深度学习数据集。该资源填补了公共数据领域良性病灶标注的空白,为核心研究问题——基于动态对比增强MRI的良恶性病灶自动分类——建立了可复现的基准框架,为提升乳腺影像诊断特异性奠定了数据基础。
当前挑战
该数据集致力于解决乳腺DCE-MRI影像中良恶性病灶鉴别这一核心领域挑战,其难点在于病灶形态学特征重叠度高、增强动力学模式复杂,且临床实践中假阳性率高达65%。在构建过程中,研究者面临原始数据异构性挑战,包括不同扫描协议的空间分辨率差异与强度信息保留需求;同时需克服标注资源稀缺性问题,通过融合仅含原发性肿瘤标注的ISPY数据集实现训练规模扩展,并设计RGB时序融合与标准化裁剪策略以平衡计算效率与特征完整性。
常用场景
经典使用场景
在乳腺影像分析领域,BreastDCEDL AMBL数据集作为首个公开包含良恶性病灶完整标注的DCE-MRI资源,为Transformer架构在医学图像分类中的验证提供了标准化基准。其典型应用场景集中于通过动态对比增强MRI序列的语义分割,实现乳腺病灶的自动化良恶性判别,SegFormer模型在该数据集上取得的0.92 AUC值,确立了其在多中心影像分析中的标杆地位。
实际应用
在临床实践中,该数据集支撑的病灶分类系统可直接应用于乳腺影像辅助诊断流程。通过量化恶性像素分布生成可解释的空间预测图,帮助放射科医生精准识别病灶增强动力学特征,在确保恶性肿瘤全检出的前提下,预计可减少三分之一不必要的穿刺活检,显著降低医疗成本与患者心理负担。
衍生相关工作
基于该数据集构建的基准模型催生了多项延伸研究,包括融合ISPY系列数据的跨中心迁移学习框架、针对非肿块强化病灶的Swin Transformer架构优化,以及结合放射组学特征的多模态融合方案。这些工作通过利用数据集提供的标准化评估协议,持续推动三维Transformer架构与联邦学习在乳腺影像分析中的创新应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作