Breast Ultrasound Images (BUSI)|乳腺超声数据集|医学图像分析数据集
收藏Breast-Cancer-Imaging-Datasets
简介
该仓库提供了一个精选的乳腺癌影像和病理学数据集列表,旨在为研究人员、临床医生和学生提供便捷的访问。数据集按成像方式分类,便于理解。该仓库包含了35个公开可用的数据集。
数据集列表
超声
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 访问数据 |
---|---|---|---|---|---|---|---|
Breast Ultrasound Images (BUSI) | 600 | 780 | PNG | 204MB | 2020 | 链接 | 下载 |
Breast Lesions USG | 256 | 522 | PNG | 66.67MB | 2024 | 链接 | 下载 |
UDIAT Breast Ultrasound Dataset B | 163 | 163 | N/A | N/A | 2017 | 链接 | 请求权限 |
OASBUD | 78 | 200 | Matlab | 296.8MB | 2017 | 链接 | 下载 |
BUS Synthetic Dataset | 0 | 500 | PNG | 9.7MB | 2023 | 链接 | 下载 |
总结:
- BUSI: 适合良性与恶性病变的分类和分割任务。
- Breast Lesions USG: 适合病变检测、分类和分割。
- UDIAT Dataset B: 适合病变检测和分类方法的开发。
- OASBUD: 提供原始超声信号,适合信号处理、分割和分类。
- BUS Synthetic Dataset: 适合模型训练和数据增强。
数字乳腺断层合成 (DBT)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Breast Cancer Screening DBT | 5060 | 22032 | DICOM | 1.63TB | 2024 | 链接 | 下载 |
EA1141 | 1444 | 500 | DICOM | 2.82TB | 2023 | 链接 | 下载 |
VICTRE | 2994 | 2994 | DICOM | 1.03TB | 2019 | 链接 | 下载 |
总结:
- Breast Cancer Screening DBT: 适合病变检测和3D重建任务。
- EA1141: 支持多模态分析和筛查优化。
- VICTRE: 适合CAD开发和比较研究。
乳腺X线摄影 (Mammography)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
CBIS-DDSM | 1566 | 6671 | DICOM | 161.51GB | 2017 | 链接 | 下载 |
CMMD | 1775 | 3728 | DICOM | 22.86GB | 2021 | 链接 | 下载 |
CDD-CESM | 326 | 2006 | JPEG | 1.5GB | 2021 | 链接 | 下载 |
VinDr-Mammo | 5000 | 200000 | DICOM | N/A | 2022 | 链接 | 下载 |
INBreast | 115 | 410 | N/A | N/A | 2012 | 链接 | 联系作者 |
MIAS | N/A | 322 | PGM | 1.5GB | 2015 | 链接 | 下载 |
Breast Tumor Mammography Dataset for Computer Vision | N/A | 3383 | JPG | 103.49MB | 2024 | N/A | 下载 |
总结:
- CBIS-DDSM: 适合分类、检测钙化和肿块分割任务。
- CMMD: 适合跨人群研究、病变检测和分类。
- CDD-CESM: 支持血管化病变的分析。
- VinDr-Mammo: 适合AI模型训练。
- INBreast: 适合算法基准测试。
- MIAS: 适合初始模型训练。
- Breast Tumor Mammography Dataset: 适合入门级实验。
MRI
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
ACRIN-6667 | 984 | 984 | DICOM | 199.59GB | 2021 | 链接 | 下载 |
ACRIN-6698 | 385 | 385 | DICOM | 1.94TB | 2021 | 链接 | 下载 |
ISPY1 | 222 | 222 | DICOM | 78.36GB | 2016 | 链接 | 下载 |
ISPY2 | 719 | 719 | DICOM | 4.16TB | 2022 | 链接 | 下载 |
Duke Breast Cancer MRI | 922 | 922 | DICOM | 368.89GB | 2022 | 链接 | 下载 |
Breast Cancer Patients MRIs | 700 | 700 | JPG | 201.4MB | 2021 | N/A | 下载 |
Breast MRI NACT Pilot | 64 | 64 | DICOM | 19.51GB | 2023 | 链接 | 下载 |
QIN Breast DCE-MRI | 10 | 10 | DICOM | 15.9GB | 2019 | 链接 | 下载 |
QIN-BREAST | 67 | 67 | DICOM | 11.41GB | 2020 | 链接 | 下载 |
QIN-BREAST-02 | 13 | 13 | DICOM | 4.19GB | 2019 | 链接 | 下载 |
Advanced MRI Breast Lesions | 632 | 632 | DICOM | 646GB | 2024 | 链接 | 下载 |
BREAST DIAGNOSIS | 88 | 88 | DICOM | 60.87GB | 2011 | 链接 | 下载 |
总结:
- ACRIN-6667 & ACRIN-6698: 适合评估新辅助化疗反应。
- ISPY1 & ISPY2: 适合预测治疗反应。
- Duke Breast Cancer MRI: 适合病变特征化。
- Breast Cancer Patients MRI’s: 适合基本分类任务。
- Breast MRI NACT Pilot: 适合治疗反应分析。
- QIN (Breast DCE-MRI, QIN-BREAST, QIN-BREAST-02): 适合基准测试。
- Advanced MRI Breast Lesions: 适合复杂模型评估。
- BREAST DIAGNOSIS: 适合诊断特征提取。
病理学
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Post NAT BRCA | 54 | 54 | SVS | 42.3GB | 2019 | 链接 | 下载 |
Breast Histopathology Images | 162 | 162 | PNG | 1.6GB | 2016 | 链接 | 下载 |
BreakHis | 82 | 7909 | PNG | N/A | 2016 | 链接 | 下载 |
Breast Cancer Cell Segmentation | N/A | 58 | TIFF | 159.82MB | 2019 | 链接 | 下载 |
BCSS | 25 | 151 | RGB | N/A | 2019 | 链接 | 下载 |
TUPAC16 | 500 | N/A | SVS | 848GB | 2016 | 链接 | 下载 |
CAMELYON | 200 | 1399 | TIFF | N/A | 2018 | [链接](https://pmc.ncbi.nlm.nih.gov/articles/PMC6007545 |

UIEB, U45, LSUI
本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。
github 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
CMU-MOSI
CMU-MOSI数据集包括了从93个YouTube的视频中获取的2199个独白类型的短视频片段。每个片段都是一个独立的多模态示例,其中图像、文本和音频占比是均匀的,情感分数取值为[-3,+3],表示从强负向到强正向情感。
DataCite Commons 收录
Stanford Cars
Cars数据集包含196类汽车的16,185图像。数据被分成8,144训练图像和8,041测试图像,其中每个类被大致分成50-50。类别通常在品牌,型号,年份,例如2012特斯拉Model S或2012 BMW M3 coupe的级别。
OpenDataLab 收录
LMHLD (Large-scale Multi-source High-resolution Landslide Dataset)
LMHLD是一个大规模多源高分辨率滑坡数据集,由中国地质大学(武汉)未来技术学院构建。该数据集收集了全球七个研究区域的遥感图像,包括中国汶川、巴西里约热内卢、尼泊尔戈尔卡、中国九寨沟、中国台湾、日本北海道和意大利艾米利亚-罗马涅,涵盖了不同触发条件下的多种类型滑坡。数据集包含25365个不同大小的斑块,以适应不同尺度的滑坡检测需求,为基于深度学习的滑坡检测提供了丰富的训练样本。
arXiv 收录