dbaek111/CBIS-DDSM_1024
收藏Hugging Face2024-03-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dbaek111/CBIS-DDSM_1024
下载链接
链接失效反馈官方服务:
资源简介:
CBIS-DDSM数据集包含1,566名患者的乳腺X光片,以DICOM格式提供,并附有CSV格式的元数据。原始图像总数为3,120张,排除了34张后,剩下3,086张图像。这些图像被转换为8位PNG格式,并根据病理结果分为cancer和not_cancer两个文件夹,用于训练和测试目的。
The CBIS-DDSM dataset consists of mammograms for 1,566 patients provided in DICOM format with metadata in CSV files. Among its contents, the full mammogram images, which originally numbered 3,120, had 34 excluded, resulting in 3,086 images. These were then converted to 8-bit PNG files and organized into cancer and not_cancer folders based on their pathology for both training and testing purposes.
提供机构:
dbaek111
原始信息汇总
CBIS-DDSM 数据集概述
数据集组成
- 患者数量:1,566 名患者
- 原始图像数量:3,120 张
- 排除图像数量:34 张
- 最终图像数量:3,086 张
图像格式与组织
- 原始格式:DICOM
- 转换格式:8-bit PNG
- 组织方式:根据病理分为 cancer 和 not_cancer 文件夹,用于训练和测试
元数据
- 元数据格式:CSV 文件
搜集汇总
数据集介绍

构建方式
在医学影像分析领域,CBIS-DDSM_1024数据集的构建采用了将原始DICOM格式的哺乳动物图像转换为8位PNG格式的方法。该数据集涵盖1,566名患者的哺乳动物图像,原始图像数量为3,120张,经过筛选后剩余3,086张。这些图像根据病理结果被分为'cancer'和'not_cancer'两个文件夹,分别用于训练和测试。
特点
CBIS-DDSM_1024数据集的特点在于其详尽的医学图像和对应的病理标签,为乳腺癌的自动检测提供了珍贵资源。数据集以DICOM格式提供,并伴有CSV格式的元数据,便于研究者进行深入分析。图像的标准化处理和分类组织,使得该数据集在机器学习模型的训练和验证中具有重要价值。
使用方法
使用CBIS-DDSM_1024数据集时,研究者首先需要将数据集解压并加载相应的CSV文件以获取图像的元数据信息。之后,可以根据需求选择对应的图像文件夹进行读取和预处理。数据集的PNG格式使得图像处理更加便捷,且易于集成到现有的机器学习框架中。
背景与挑战
背景概述
在医学影像分析领域,乳腺癌的早期发现与诊断至关重要。CBIS-DDSM数据集,创建于21世纪初,由美国Case Western Reserve University的研究人员开发,旨在提供一种用于乳腺癌检测的开放资源。该数据集包含1,566名患者的乳腺X射线成像(mammograms),以DICOM格式存储,并伴有CSV格式的元数据。数据集的核心研究问题是提高乳腺癌的自动检测准确率,对医学影像处理、计算机视觉以及机器学习领域产生了深远的影响。
当前挑战
CBIS-DDSM数据集在构建过程中遇到的挑战主要包括数据的标准化处理和隐私保护。数据集中的乳腺X射线图像需转换为8-bit PNG格式,以便于算法处理,同时确保图像质量不受影响。此外,图像的标注与分类——即根据病理学结果分为'癌症'与'非癌症'——是一个精确度要求极高的任务,对标注人员的专业知识和经验提出了挑战。在解决领域问题上,如何提高模型的敏感性和特异性,减少假阴性和假阳性结果,是该数据集应用中的主要挑战。
常用场景
经典使用场景
在医学图像分析领域,dbaek111/CBIS-DDSM_1024数据集的经典使用场景主要集中于乳腺癌的早期诊断。该数据集提供了丰富的乳腺X射线成像资料,通过将 mammogram 图像转换为 8-bit PNG 文件,并按照病变与否分类,为研究者构建深度学习模型提供了标准化和结构化的数据支持,从而使得计算机辅助诊断系统可以准确识别出潜在的乳腺癌病变。
衍生相关工作
基于该数据集,学术界衍生出了一系列经典工作,包括但不限于乳腺癌病变检测、分类算法研究以及影像组学特征提取等。这些研究进一步拓展了数据集的应用范围,推动了医学图像分析技术的发展,并在临床实践中展示了良好的应用前景。
数据集最近研究
最新研究方向
在医学影像分析领域,基于CBIS-DDSM_1024数据集的研究日益成为热点。该数据集包含了1,566名患者的乳腺X射线成像资料,其独特的 DICOM 格式及详细的CSV格式元数据,为研究者提供了宝贵的资源。当前,前沿研究方向聚焦于深度学习模型的优化,以提升对乳腺肿瘤的自动识别准确性。近期研究不仅涉及图像分割、特征提取等传统问题,还深入探讨了转移学习在乳腺疾病诊断中的应用,以及多模态影像数据的融合处理,这为早期发现和治疗乳腺癌带来了新的可能性,具有重要的临床影响和科研价值。
以上内容由遇见数据集搜集并总结生成



