Breast Ultrasound Images (BUSI)|乳腺超声数据集|医学图像分析数据集
收藏Breast-Cancer-Imaging-Datasets
简介
该仓库提供了一个精选的乳腺癌影像和病理学数据集列表,旨在为研究人员、临床医生和学生提供便捷的访问。数据集按成像方式分类,便于理解。该仓库包含了35个公开可用的数据集。
数据集列表
超声
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 访问数据 |
---|---|---|---|---|---|---|---|
Breast Ultrasound Images (BUSI) | 600 | 780 | PNG | 204MB | 2020 | 链接 | 下载 |
Breast Lesions USG | 256 | 522 | PNG | 66.67MB | 2024 | 链接 | 下载 |
UDIAT Breast Ultrasound Dataset B | 163 | 163 | N/A | N/A | 2017 | 链接 | 请求权限 |
OASBUD | 78 | 200 | Matlab | 296.8MB | 2017 | 链接 | 下载 |
BUS Synthetic Dataset | 0 | 500 | PNG | 9.7MB | 2023 | 链接 | 下载 |
总结:
- BUSI: 适合良性与恶性病变的分类和分割任务。
- Breast Lesions USG: 适合病变检测、分类和分割。
- UDIAT Dataset B: 适合病变检测和分类方法的开发。
- OASBUD: 提供原始超声信号,适合信号处理、分割和分类。
- BUS Synthetic Dataset: 适合模型训练和数据增强。
数字乳腺断层合成 (DBT)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Breast Cancer Screening DBT | 5060 | 22032 | DICOM | 1.63TB | 2024 | 链接 | 下载 |
EA1141 | 1444 | 500 | DICOM | 2.82TB | 2023 | 链接 | 下载 |
VICTRE | 2994 | 2994 | DICOM | 1.03TB | 2019 | 链接 | 下载 |
总结:
- Breast Cancer Screening DBT: 适合病变检测和3D重建任务。
- EA1141: 支持多模态分析和筛查优化。
- VICTRE: 适合CAD开发和比较研究。
乳腺X线摄影 (Mammography)
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
CBIS-DDSM | 1566 | 6671 | DICOM | 161.51GB | 2017 | 链接 | 下载 |
CMMD | 1775 | 3728 | DICOM | 22.86GB | 2021 | 链接 | 下载 |
CDD-CESM | 326 | 2006 | JPEG | 1.5GB | 2021 | 链接 | 下载 |
VinDr-Mammo | 5000 | 200000 | DICOM | N/A | 2022 | 链接 | 下载 |
INBreast | 115 | 410 | N/A | N/A | 2012 | 链接 | 联系作者 |
MIAS | N/A | 322 | PGM | 1.5GB | 2015 | 链接 | 下载 |
Breast Tumor Mammography Dataset for Computer Vision | N/A | 3383 | JPG | 103.49MB | 2024 | N/A | 下载 |
总结:
- CBIS-DDSM: 适合分类、检测钙化和肿块分割任务。
- CMMD: 适合跨人群研究、病变检测和分类。
- CDD-CESM: 支持血管化病变的分析。
- VinDr-Mammo: 适合AI模型训练。
- INBreast: 适合算法基准测试。
- MIAS: 适合初始模型训练。
- Breast Tumor Mammography Dataset: 适合入门级实验。
MRI
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
ACRIN-6667 | 984 | 984 | DICOM | 199.59GB | 2021 | 链接 | 下载 |
ACRIN-6698 | 385 | 385 | DICOM | 1.94TB | 2021 | 链接 | 下载 |
ISPY1 | 222 | 222 | DICOM | 78.36GB | 2016 | 链接 | 下载 |
ISPY2 | 719 | 719 | DICOM | 4.16TB | 2022 | 链接 | 下载 |
Duke Breast Cancer MRI | 922 | 922 | DICOM | 368.89GB | 2022 | 链接 | 下载 |
Breast Cancer Patients MRIs | 700 | 700 | JPG | 201.4MB | 2021 | N/A | 下载 |
Breast MRI NACT Pilot | 64 | 64 | DICOM | 19.51GB | 2023 | 链接 | 下载 |
QIN Breast DCE-MRI | 10 | 10 | DICOM | 15.9GB | 2019 | 链接 | 下载 |
QIN-BREAST | 67 | 67 | DICOM | 11.41GB | 2020 | 链接 | 下载 |
QIN-BREAST-02 | 13 | 13 | DICOM | 4.19GB | 2019 | 链接 | 下载 |
Advanced MRI Breast Lesions | 632 | 632 | DICOM | 646GB | 2024 | 链接 | 下载 |
BREAST DIAGNOSIS | 88 | 88 | DICOM | 60.87GB | 2011 | 链接 | 下载 |
总结:
- ACRIN-6667 & ACRIN-6698: 适合评估新辅助化疗反应。
- ISPY1 & ISPY2: 适合预测治疗反应。
- Duke Breast Cancer MRI: 适合病变特征化。
- Breast Cancer Patients MRI’s: 适合基本分类任务。
- Breast MRI NACT Pilot: 适合治疗反应分析。
- QIN (Breast DCE-MRI, QIN-BREAST, QIN-BREAST-02): 适合基准测试。
- Advanced MRI Breast Lesions: 适合复杂模型评估。
- BREAST DIAGNOSIS: 适合诊断特征提取。
病理学
数据集 | 受试者数量 | 样本数量 | 格式 | 大小 | 年份 | 引用 | 下载 |
---|---|---|---|---|---|---|---|
Post NAT BRCA | 54 | 54 | SVS | 42.3GB | 2019 | 链接 | 下载 |
Breast Histopathology Images | 162 | 162 | PNG | 1.6GB | 2016 | 链接 | 下载 |
BreakHis | 82 | 7909 | PNG | N/A | 2016 | 链接 | 下载 |
Breast Cancer Cell Segmentation | N/A | 58 | TIFF | 159.82MB | 2019 | 链接 | 下载 |
BCSS | 25 | 151 | RGB | N/A | 2019 | 链接 | 下载 |
TUPAC16 | 500 | N/A | SVS | 848GB | 2016 | 链接 | 下载 |
CAMELYON | 200 | 1399 | TIFF | N/A | 2018 | [链接](https://pmc.ncbi.nlm.nih.gov/articles/PMC6007545 |

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
中国车牌识别数据集(7类,33万张)
这是一个高质量、平衡的中国车牌识别数据集,包含了33万张各类中国车牌的图片。数据集经过精心设计,确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。
魔搭社区 收录
中国区域环境数据库
该数据集包含中国各区域的环境数据,涵盖空气质量、水质、土壤污染等多个方面的指标。数据以时间序列的形式记录,便于进行长期的环境变化分析。
www.mee.gov.cn 收录