Breast Ultrasound Images (BUSI)|乳腺超声数据集|医学图像分析数据集
收藏Breast-Cancer-Imaging-Datasets
简介
该仓库提供了一个精选的乳腺癌影像和病理学数据集列表,旨在为研究人员、临床医生和学生提供便捷的访问。数据集按成像方式分类,便于理解。该仓库包含了35个公开可用的数据集。
数据集列表
超声
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 访问数据 |
---|---|---|---|---|---|---|---|
Breast Ultrasound Images (BUSI) | 600 | 780 | PNG | 204MB | 2020 | 链接 | 下载 |
Breast Lesions USG | 256 | 522 | PNG | 66.67MB | 2024 | 链接 | 下载 |
UDIAT Breast Ultrasound Dataset B | 163 | 163 | N/A | N/A | 2017 | 链接 | 请求权限 |
OASBUD | 78 | 200 | Matlab | 296.8MB | 2017 | 链接 | 下载 |
BUS Synthetic Dataset | 0 | 500 | PNG | 9.7MB | 2023 | 链接 | 下载 |
总结:
- BUSI: 适合良性与恶性病变的分类和分割任务。
- Breast Lesions USG: 适合病变检测、分类和分割。
- UDIAT Dataset B: 适合病变检测和分类方法的开发。
- OASBUD: 提供原始超声信号,适合信号处理、分割和分类。
- BUS Synthetic Dataset: 适合模型训练和数据增强。
数字乳腺断层合成 (DBT)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Breast Cancer Screening DBT | 5060 | 22032 | DICOM | 1.63TB | 2024 | 链接 | 下载 |
EA1141 | 1444 | 500 | DICOM | 2.82TB | 2023 | 链接 | 下载 |
VICTRE | 2994 | 2994 | DICOM | 1.03TB | 2019 | 链接 | 下载 |
总结:
- Breast Cancer Screening DBT: 适合病变检测和3D重建任务。
- EA1141: 支持多模态分析和筛查优化。
- VICTRE: 适合CAD开发和比较研究。
乳腺X线摄影 (Mammography)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
CBIS-DDSM | 1566 | 6671 | DICOM | 161.51GB | 2017 | 链接 | 下载 |
CMMD | 1775 | 3728 | DICOM | 22.86GB | 2021 | 链接 | 下载 |
CDD-CESM | 326 | 2006 | JPEG | 1.5GB | 2021 | 链接 | 下载 |
VinDr-Mammo | 5000 | 200000 | DICOM | N/A | 2022 | 链接 | 下载 |
INBreast | 115 | 410 | N/A | N/A | 2012 | 链接 | 联系作者 |
MIAS | N/A | 322 | PGM | 1.5GB | 2015 | 链接 | 下载 |
Breast Tumor Mammography Dataset for Computer Vision | N/A | 3383 | JPG | 103.49MB | 2024 | N/A | 下载 |
总结:
- CBIS-DDSM: 适合分类、检测钙化和肿块分割任务。
- CMMD: 适合跨人群研究、病变检测和分类。
- CDD-CESM: 支持血管化病变的分析。
- VinDr-Mammo: 适合AI模型训练。
- INBreast: 适合算法基准测试。
- MIAS: 适合初始模型训练。
- Breast Tumor Mammography Dataset: 适合入门级实验。
MRI
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
ACRIN-6667 | 984 | 984 | DICOM | 199.59GB | 2021 | 链接 | 下载 |
ACRIN-6698 | 385 | 385 | DICOM | 1.94TB | 2021 | 链接 | 下载 |
ISPY1 | 222 | 222 | DICOM | 78.36GB | 2016 | 链接 | 下载 |
ISPY2 | 719 | 719 | DICOM | 4.16TB | 2022 | 链接 | 下载 |
Duke Breast Cancer MRI | 922 | 922 | DICOM | 368.89GB | 2022 | 链接 | 下载 |
Breast Cancer Patients MRIs | 700 | 700 | JPG | 201.4MB | 2021 | N/A | 下载 |
Breast MRI NACT Pilot | 64 | 64 | DICOM | 19.51GB | 2023 | 链接 | 下载 |
QIN Breast DCE-MRI | 10 | 10 | DICOM | 15.9GB | 2019 | 链接 | 下载 |
QIN-BREAST | 67 | 67 | DICOM | 11.41GB | 2020 | 链接 | 下载 |
QIN-BREAST-02 | 13 | 13 | DICOM | 4.19GB | 2019 | 链接 | 下载 |
Advanced MRI Breast Lesions | 632 | 632 | DICOM | 646GB | 2024 | 链接 | 下载 |
BREAST DIAGNOSIS | 88 | 88 | DICOM | 60.87GB | 2011 | 链接 | 下载 |
总结:
- ACRIN-6667 & ACRIN-6698: 适合评估新辅助化疗反应。
- ISPY1 & ISPY2: 适合预测治疗反应。
- Duke Breast Cancer MRI: 适合病变特征化。
- Breast Cancer Patients MRI’s: 适合基本分类任务。
- Breast MRI NACT Pilot: 适合治疗反应分析。
- QIN (Breast DCE-MRI, QIN-BREAST, QIN-BREAST-02): 适合基准测试。
- Advanced MRI Breast Lesions: 适合复杂模型评估。
- BREAST DIAGNOSIS: 适合诊断特征提取。
病理学
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Post NAT BRCA | 54 | 54 | SVS | 42.3GB | 2019 | 链接 | 下载 |
Breast Histopathology Images | 162 | 162 | PNG | 1.6GB | 2016 | 链接 | 下载 |
BreakHis | 82 | 7909 | PNG | N/A | 2016 | 链接 | 下载 |
Breast Cancer Cell Segmentation | N/A | 58 | TIFF | 159.82MB | 2019 | 链接 | 下载 |
BCSS | 25 | 151 | RGB | N/A | 2019 | 链接 | 下载 |
TUPAC16 | 500 | N/A | SVS | 848GB | 2016 | 链接 | 下载 |
CAMELYON | 200 | 1399 | TIFF | N/A | 2018 | [链接](https://pmc.ncbi.nlm.nih.gov/articles/PMC6007545 |

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
INTERACTION Dataset
INTERACTION数据集是由加州大学伯克利分校机械系统控制实验室等多个国际研究机构合作创建的,旨在为自动驾驶领域提供高质量的交互式驾驶场景数据。该数据集包含多种复杂的交互式驾驶场景,如城市/高速公路/匝道合并和车道变更、环形交叉口、信号交叉口等,覆盖多个国家和文化背景,以自然方式包含不同文化的驾驶偏好和风格。数据集强调高度交互和复杂的驾驶行为,包括对抗性和合作性运动,以及从常规安全操作到危险、接近碰撞的操纵。此外,数据集提供完整的语义地图信息,包括物理层、参考线、车道连接和交通规则,记录自无人机和交通摄像头。该数据集适用于运动预测、模仿学习、决策制定和规划、表示学习、交互提取和社会行为生成等研究领域,旨在解决自动驾驶中的关键问题。
arXiv 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录