Breast Ultrasound Images (BUSI)|乳腺超声数据集|医学图像分析数据集
收藏Breast-Cancer-Imaging-Datasets
简介
该仓库提供了一个精选的乳腺癌影像和病理学数据集列表,旨在为研究人员、临床医生和学生提供便捷的访问。数据集按成像方式分类,便于理解。该仓库包含了35个公开可用的数据集。
数据集列表
超声
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 访问数据 |
---|---|---|---|---|---|---|---|
Breast Ultrasound Images (BUSI) | 600 | 780 | PNG | 204MB | 2020 | 链接 | 下载 |
Breast Lesions USG | 256 | 522 | PNG | 66.67MB | 2024 | 链接 | 下载 |
UDIAT Breast Ultrasound Dataset B | 163 | 163 | N/A | N/A | 2017 | 链接 | 请求权限 |
OASBUD | 78 | 200 | Matlab | 296.8MB | 2017 | 链接 | 下载 |
BUS Synthetic Dataset | 0 | 500 | PNG | 9.7MB | 2023 | 链接 | 下载 |
总结:
- BUSI: 适合良性与恶性病变的分类和分割任务。
- Breast Lesions USG: 适合病变检测、分类和分割。
- UDIAT Dataset B: 适合病变检测和分类方法的开发。
- OASBUD: 提供原始超声信号,适合信号处理、分割和分类。
- BUS Synthetic Dataset: 适合模型训练和数据增强。
数字乳腺断层合成 (DBT)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Breast Cancer Screening DBT | 5060 | 22032 | DICOM | 1.63TB | 2024 | 链接 | 下载 |
EA1141 | 1444 | 500 | DICOM | 2.82TB | 2023 | 链接 | 下载 |
VICTRE | 2994 | 2994 | DICOM | 1.03TB | 2019 | 链接 | 下载 |
总结:
- Breast Cancer Screening DBT: 适合病变检测和3D重建任务。
- EA1141: 支持多模态分析和筛查优化。
- VICTRE: 适合CAD开发和比较研究。
乳腺X线摄影 (Mammography)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
CBIS-DDSM | 1566 | 6671 | DICOM | 161.51GB | 2017 | 链接 | 下载 |
CMMD | 1775 | 3728 | DICOM | 22.86GB | 2021 | 链接 | 下载 |
CDD-CESM | 326 | 2006 | JPEG | 1.5GB | 2021 | 链接 | 下载 |
VinDr-Mammo | 5000 | 200000 | DICOM | N/A | 2022 | 链接 | 下载 |
INBreast | 115 | 410 | N/A | N/A | 2012 | 链接 | 联系作者 |
MIAS | N/A | 322 | PGM | 1.5GB | 2015 | 链接 | 下载 |
Breast Tumor Mammography Dataset for Computer Vision | N/A | 3383 | JPG | 103.49MB | 2024 | N/A | 下载 |
总结:
- CBIS-DDSM: 适合分类、检测钙化和肿块分割任务。
- CMMD: 适合跨人群研究、病变检测和分类。
- CDD-CESM: 支持血管化病变的分析。
- VinDr-Mammo: 适合AI模型训练。
- INBreast: 适合算法基准测试。
- MIAS: 适合初始模型训练。
- Breast Tumor Mammography Dataset: 适合入门级实验。
MRI
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
ACRIN-6667 | 984 | 984 | DICOM | 199.59GB | 2021 | 链接 | 下载 |
ACRIN-6698 | 385 | 385 | DICOM | 1.94TB | 2021 | 链接 | 下载 |
ISPY1 | 222 | 222 | DICOM | 78.36GB | 2016 | 链接 | 下载 |
ISPY2 | 719 | 719 | DICOM | 4.16TB | 2022 | 链接 | 下载 |
Duke Breast Cancer MRI | 922 | 922 | DICOM | 368.89GB | 2022 | 链接 | 下载 |
Breast Cancer Patients MRIs | 700 | 700 | JPG | 201.4MB | 2021 | N/A | 下载 |
Breast MRI NACT Pilot | 64 | 64 | DICOM | 19.51GB | 2023 | 链接 | 下载 |
QIN Breast DCE-MRI | 10 | 10 | DICOM | 15.9GB | 2019 | 链接 | 下载 |
QIN-BREAST | 67 | 67 | DICOM | 11.41GB | 2020 | 链接 | 下载 |
QIN-BREAST-02 | 13 | 13 | DICOM | 4.19GB | 2019 | 链接 | 下载 |
Advanced MRI Breast Lesions | 632 | 632 | DICOM | 646GB | 2024 | 链接 | 下载 |
BREAST DIAGNOSIS | 88 | 88 | DICOM | 60.87GB | 2011 | 链接 | 下载 |
总结:
- ACRIN-6667 & ACRIN-6698: 适合评估新辅助化疗反应。
- ISPY1 & ISPY2: 适合预测治疗反应。
- Duke Breast Cancer MRI: 适合病变特征化。
- Breast Cancer Patients MRI’s: 适合基本分类任务。
- Breast MRI NACT Pilot: 适合治疗反应分析。
- QIN (Breast DCE-MRI, QIN-BREAST, QIN-BREAST-02): 适合基准测试。
- Advanced MRI Breast Lesions: 适合复杂模型评估。
- BREAST DIAGNOSIS: 适合诊断特征提取。
病理学
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Post NAT BRCA | 54 | 54 | SVS | 42.3GB | 2019 | 链接 | 下载 |
Breast Histopathology Images | 162 | 162 | PNG | 1.6GB | 2016 | 链接 | 下载 |
BreakHis | 82 | 7909 | PNG | N/A | 2016 | 链接 | 下载 |
Breast Cancer Cell Segmentation | N/A | 58 | TIFF | 159.82MB | 2019 | 链接 | 下载 |
BCSS | 25 | 151 | RGB | N/A | 2019 | 链接 | 下载 |
TUPAC16 | 500 | N/A | SVS | 848GB | 2016 | 链接 | 下载 |
CAMELYON | 200 | 1399 | TIFF | N/A | 2018 | [链接](https://pmc.ncbi.nlm.nih.gov/articles/PMC6007545 |

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
Tunnel Crack Detection Thermal And Visible Dataset (CrackTAV)
一个用于隧道裂缝检测的多模态数据集,包含多种通道配置,包括RGB、IR、融合的RGB-IR、RGB-T和RGB-IR模态。
github 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录