liangch/busi-whu-seg
收藏Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/liangch/busi-whu-seg
下载链接
链接失效反馈官方服务:
资源简介:
BUSI-WHU-Seg是一个标准化的乳腺超声图像分割数据集,包含良性和恶性的标注。数据集由武汉大学人民医院提供,总样本数为927个,用于分割研究。数据集结构包括训练、验证和测试集,每个集包含图像、掩码和元数据文件。数据集按类别平衡方式划分,比例为70%训练,15%验证,15%测试。文件命名规则明确,图像和掩码文件分别以benign和malignant开头。
A standardized breast ultrasound image segmentation dataset with benign and malignant annotations. The dataset is provided by Renmin Hospital of Wuhan University, with a total of 927 samples for segmentation research. The dataset structure includes training, validation, and test sets, each containing images, masks, and metadata files. The dataset is split in a class-balanced manner, with 70% for training, 15% for validation, and 15% for testing. The file naming convention is clear, with image and mask files starting with benign and malignant respectively.
提供机构:
liangch
搜集汇总
数据集介绍

构建方式
BUSI-WHU-Seg数据集源自武汉大学人民医院的乳腺超声影像资源,专为分割任务精心编撰与重构。该数据集包含927个样本,涵盖良性与恶性两类病变,并以类别均衡的方式划分数据集,其中训练集占70%,验证集与测试集各占15%。数据集采用一致的命名规则,图像与对应分割掩膜分别命名为`benign_0001.bmp`与`benign_0001_mask.bmp`等,并提供了`metadata.csv`文件记录图像与掩膜的映射关系及标签信息,为研究者提供了清晰规范的数据结构。
特点
该数据集具有鲜明的标准化特征,其图像模态为超声,任务聚焦于分割,类别明确区分良性与恶性。数据集结构井然有序,每个划分(训练、验证、测试)均包含独立的`images/`、`masks/`目录及`metadata.csv`元数据文件,便于直接加载与评估。类别均衡的划分策略确保了模型训练过程中各类别样本的代表性,而一致的文件命名与预定义划分则显著降低了数据预处理的工作量,为乳腺超声图像分割研究提供了高质量、高可靠性的基准数据集。
使用方法
使用该数据集简便直观,研究者可通过`git clone https://huggingface.co/datasets/huangjin520/busi-whu-seg`命令一键克隆至本地。随后,依据`metadata.csv`中的映射关系,即可轻松加载图像与对应掩膜进行模型训练、验证与测试。数据集已预设好训练、验证与测试划分,省去了手动分割的繁琐。该数据集与论文《Edge-Aware Multi-Scale Group-Mix Attention Network for Breast Cancer Ultrasound Image Segmentation》紧密关联,鼓励用户在学术工作中引用该研究成果,以促进乳腺超声图像分割领域的科学发展。
背景与挑战
背景概述
乳腺癌超声图像分割是医学影像分析领域的关键任务,其精确性直接影响到临床诊断与治疗决策的准确性。busi-whu-seg数据集由武汉大学人民医院的研究团队于2025年创建,发表于IEEE JBHI期刊,旨在解决乳腺超声图像中良恶性病变的自动化分割问题。该数据集包含927例样本,以良性(benign)和恶性(malignant)两类标注为核心,采用标准化命名与类平衡的70/15/15训练-验证-测试划分方案,为深度学习模型的训练与评估提供了统一基准。其推广推动了边缘感知与多尺度注意力机制等先进分割网络的发展,在乳腺癌超声图像分析领域产生了显著影响。
当前挑战
乳腺超声图像分割面临两大核心挑战。领域问题层面,超声图像固有的低对比度、高噪声、伪影以及病灶边界模糊性,使得良恶性病变的精准分割极为困难,传统方法难以区分微妙形态差异与边缘纹理。构建过程层面,该数据集由临床超声影像整理而来,需解决原始图像来源不一、标注标准统一性以及类平衡划分的技术难题;同时,为避免样本冗余与标签噪声,研究团队实施了严格的质量控制流程,确保927例样本的标注一致性,这对大规模医学数据集的构建提出了高要求。
常用场景
经典使用场景
在医学影像分析领域,乳腺癌超声图像分割是计算机辅助诊断的核心环节之一。busi-whu-seg数据集作为一项标准化的乳腺超声图像分割资源,汇聚了927例良性与恶性病灶的超声图像及其对应的分割掩膜,为研究者提供了规范化、类均衡的训练/验证/测试划分。该数据集最经典的用途在于训练和评估深度学习分割模型,如U-Net、Attention U-Net及其变体,以精准勾勒病灶边界,从而辅助医生进行良恶性判别。其统一的文件命名和元数据管理显著降低了数据预处理门槛,使得研究者能够专注于模型架构设计与性能优化,加速了乳腺超声图像分割领域的实验迭代与成果复现。
衍生相关工作
围绕busi-whu-seg数据集,学术界已涌现出一系列经典创新工作。最直接的衍生工作是发布该数据集时同步提出的Edge-Aware Multi-Scale Group-Mix Attention Network(EMGANet),该网络通过边缘感知机制与多尺度组混合注意力模块有效捕获病灶的边界细节与多级语义信息,在良恶性分割任务上取得了先进性能。此外,该数据集也被广泛用作基准,用于验证和比较各类新型分割框架,如结合Transformer与CNN的混合架构、基于对比学习的弱监督分割方法等。这些衍生工作不仅丰富了乳腺超声图像分割的技术体系,也推动了医学图像分析领域对注意力机制、多尺度特征融合等前沿范式的探索与应用。
数据集最近研究
最新研究方向
在乳腺癌超声图像分割领域,busi-whu-seg数据集凭借其标准化的良恶性病灶标注与精心划分的训练-验证-测试集,为构建精准且具有临床普适性的分割模型提供了坚实的数据基础。前沿研究方向聚焦于融合边缘感知与多尺度特征的深度学习架构,如边缘感知多尺度组混合注意力网络(EMGANet),旨在克服超声图像中病灶边界模糊、形态多样及噪声干扰等挑战。相关研究热点紧密关联于人工智能辅助乳腺癌早筛的临床需求,通过提升分割精度与泛化能力,该数据集推动着从影像特征自动提取到风险分层评估的技术演进,对降低漏诊率、优化诊疗流程具有显著的科学价值与现实意义。
以上内容由遇见数据集搜集并总结生成



