gymprathap/Breast-Cancer-Ultrasound-Images-Dataset
收藏Hugging Face2023-12-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gymprathap/Breast-Cancer-Ultrasound-Images-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自25至75岁女性的乳腺癌超声图像,分为正常、良性和恶性三类。数据集共有780张图像,每张图像的尺寸为500x500像素,保存为PNG格式。数据集旨在通过机器学习技术提高乳腺癌的检测、分类和分割能力。
该数据集包含来自25至75岁女性的乳腺癌超声图像,分为正常、良性和恶性三类。数据集共有780张图像,每张图像的尺寸为500x500像素,保存为PNG格式。数据集旨在通过机器学习技术提高乳腺癌的检测、分类和分割能力。
提供机构:
gymprathap
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-4.0
- 语言: 英语
- 标签: 医学
- 名称: Breast Cancer Ultrasound Images Detection
- 大小: 1K<n<10K
数据描述
- 背景: 乳腺癌在全球女性主要死因中排名靠前,通过早期检测可以减少过早死亡。
- 数据来源: 基于显示乳腺癌迹象的医学超声扫描。
- 图像类型: 数据集包含三种类型的图像:正常、良性、恶性。
- 应用: 将机器学习应用于乳腺超声图像,以提高乳腺癌的检测、分类和分割能力。
详细数据
- 患者年龄: 25–75岁
- 患者数量: 600名女性
- 图像数量: 780张
- 图像尺寸: 平均500x500像素
- 文件格式: PNG
- 图像分类: 正常、良性、恶性
引用信息
- 作者: Al-Dhabyani, Gomaa, Khaled, 和 Fahmy
- 文章标题: Breast ultrasound image dataset
- 出版信息: 2020年2月,文章编号28,发表于10.1016/j.dib.2019.104863
搜集汇总
数据集介绍

构建方式
在医学影像分析领域,构建高质量数据集对于推动乳腺癌早期诊断技术的发展至关重要。本数据集基于2020年收集的临床超声影像,涵盖了600名年龄介于25至75岁女性患者的医学数据。数据采集过程严格遵循临床规范,共包含780张分辨率为500×500像素的PNG格式图像,每幅图像均配有对应的真实标注影像。数据样本经过专业医学标注,划分为正常、良性、恶性三类病理类型,形成了结构清晰的分类体系。
使用方法
在医学人工智能研究实践中,本数据集适用于多种计算机视觉任务。研究人员可将其用于开发乳腺癌自动检测与分类模型,通过监督学习训练卷积神经网络识别不同病理类型的超声影像特征。数据集支持图像分割任务,利用配套的真实标注图像训练语义分割模型。在算法验证阶段,可采用交叉验证方法评估模型泛化能力。使用时应遵循CC-BY-4.0许可协议,并在学术成果中引用原始文献来源。
背景与挑战
背景概述
在医学影像分析领域,乳腺癌的早期检测是提升患者生存率的关键环节。由Al-Dhabyani等研究人员于2020年构建的乳腺超声图像数据集,聚焦于通过机器学习技术辅助乳腺癌的识别与分类。该数据集收录了来自600名25至75岁女性的780张超声图像,涵盖正常、良性及恶性三类病理状态,每张图像分辨率达500×500像素并以PNG格式存储。其创建旨在推动计算机辅助诊断系统的发展,为乳腺癌的自动化检测提供了重要的数据基础,对医学影像分析领域产生了显著的学术影响力。
当前挑战
该数据集致力于解决乳腺癌超声图像自动分类的挑战,其核心问题在于区分良性、恶性及正常组织的细微影像差异,这对模型的判别精度提出了极高要求。在构建过程中,研究人员面临数据采集的复杂性,包括患者年龄跨度大、影像质量受设备及操作者影响而产生的变异,以及标注过程中对病理状态的准确界定需依赖专业医学知识。此外,数据规模的有限性可能制约深度学习模型的泛化能力,而影像中组织结构的重叠与噪声干扰进一步增加了特征提取的难度。
常用场景
经典使用场景
在医学影像分析领域,该数据集为乳腺癌超声图像的自动检测与分类提供了关键资源。研究人员通常利用其包含的正常、良性和恶性三类图像,构建深度学习模型,如卷积神经网络,以实现对超声图像的精准分类。这一过程不仅验证了模型在区分不同病理状态上的有效性,还为后续的临床辅助诊断系统奠定了数据基础。
解决学术问题
该数据集直接应对了乳腺癌早期诊断中图像数据稀缺和标注标准化的学术挑战。通过提供高质量、多类别的超声图像,它支持了机器学习算法在医学影像分类、分割及检测任务中的性能评估与优化。其意义在于推动了计算机辅助诊断技术的发展,降低了人工解读的主观误差,为提升乳腺癌筛查的准确性和效率贡献了实证数据。
实际应用
在实际医疗场景中,该数据集被广泛应用于开发智能诊断工具,辅助放射科医生快速识别超声图像中的异常区域。例如,基于该数据训练的模型可集成到医院影像系统中,实现实时病灶检测,缩短诊断时间,并提高偏远地区医疗资源的可及性。这不仅优化了临床工作流程,还为个性化治疗方案的制定提供了数据支持。
数据集最近研究
最新研究方向
在医学影像分析领域,乳腺癌超声图像数据集正推动深度学习技术的前沿探索。当前研究聚焦于多模态融合与弱监督学习,通过结合超声图像与临床数据提升模型泛化能力,以应对图像噪声和标注稀缺的挑战。热点事件如国际乳腺癌筛查指南的更新,促使学术界关注自动化分类与分割算法的临床可解释性,旨在辅助早期诊断并减少假阳性率。这些进展不仅优化了医疗决策流程,也为个性化治疗方案的制定提供了数据支撑,对全球女性健康具有深远意义。
以上内容由遇见数据集搜集并总结生成



