medical-dataset|医学影像数据集|临床研究数据集
收藏医学成像数据集列表
主要医学成像数据集
CheXpert
- 数据量: 224,316张胸片,涉及65,240名患者
- 关键词: 非常大,X光,标签
ChestXray-NIHCC
- 数据量: 100,000张胸片
- 关键词: 非常大,X光,标签
MIMIC-CXR
- 数据量: 371,920张胸片,关联227,943项影像研究
- 关键词: 非常大,X光,标签
PadChest
- 数据量: 160,000张图像,来自67,000名患者
- 关键词: 非常大,X光,标签
IBM Xray Eye Gaze
- 数据量: 1000+数据集,包括眼动、放射学报告、听写、分割
- 关键词: 中等,X光,标签
Cancer Image Archive
- 数据量: 多种类型的图像,包括CT、MR、病理、PT
- 关键词: 非常大,CT, MR, 标签
National Lung Screening Trial
- 数据量: 超过50,000名患者,CT数据
- 关键词: 非常大,CT, 标签
DeepLesion
- 数据量: 32,000+ CT扫描,带注释和元数据
- 关键词: 非常大,CT, 标签
EchoNet-Dynamic
- 数据量: 10,000+标记的心脏超声视频和人类专家追踪
- 关键词: 非常大,超声,标签
ABCD Neurocognitive Prediction Challenge
- 数据量: MRI数据,8500名年轻(9-10岁)受试者
- 关键词: 大,MRI
AAPM Sparse-View CT Reconstruction Challenge
- 数据量: 4,000对模拟的2D乳房CT的投影图/图像对
- 关键词: 大,CT, 重建
Cross-Sectional Multidomain Lexical Processing
- 数据量: 超过3000 MRI, fMRI
- 关键词: 大,MRI
MRNet
- 数据量: 1,370膝关节MRI检查,带诊断
- 关键词: 大,MRI, 标签
fastMRI
- 数据量: k空间数据,1500完全采样的膝关节MRIs和10K临床MRIs,以及6.5K脑MRIs
- 关键词: 大,MRI, k空间
OCMR
- 数据量: k空间数据,约250个体积
- 关键词: 中等,MRI, k空间
PREVENT-AD
- 数据量: 1704 MRI, 556淀粉样蛋白和tau CSF样本,血液标记物,遗传信息和纵向认知数据
- 关键词: 中等,MRI, 遗传学, 标签
Medical Segmentation Decathlon
- 数据量: 10个医学图像数据集,带分割
- 关键词: 中等,MRI, 分割
MASSIVE
- 数据量: 8000扩散加权体积
- 关键词: 大,MRI
AOMIC: the Amsterdam Open MRI Collection
- 数据量: 1000+ fMRI和其他模式受试者,带注释事件文件
- 关键词: 中等,fMRI
MRIdata
- 数据量: MRI k空间数据集列表
Cancer Imaging Archive: LDCT
- 数据量: 601系列CT投影数据,重建图像和临床数据报告
- 关键词: 中等,CT, 重建
Brain MRI LGG FLAIR异常分割
- 数据量: 脑MRI图像与手动FLAIR异常分割掩码
- 关键词: 中等,脑,MRI, 分割, LGG, FLAIR
Studyforrest
- 数据量: 多种模式(T1,T2,SWI,Angio,DWI, fMRI等)
- 关键词: 小,多模态
Lung Image Database Consortium
- 数据量: 诊断和肺癌筛查CTs,1018例
- 关键词: 大,CT, 标签
Breast Cancer MRI Dataset
- 数据量: 922名乳腺癌患者,公开可用
- 关键词: 大,MRI, 标签
UK Biobank
- 数据量: 非常大量
- 关键词: 非常大
OpenOrganelle
- 数据量: 高分辨率组织规模体积电子显微镜(vEM)数据集
- 关键词: 非常大,EM, 分割
BrixIA: COVID19严重程度评分评估数据库
- 数据量: 4703张COVID19患者CXR,手动注释Brixia评分
- 关键词: 大,X光,COVID
COVID-CT
- 数据量: 349张CT图像,来自几篇COVID19相关论文
- 关键词: 中等,CT, COVID
Pneumonia X-Ray
- 数据量: 约5000张X光片
- 关键词: 中等,X光,肺炎
Medical Imaging Data Resource Center (MIDRC)
- 数据量: 998张胸片,来自361名COVID+患者
- 关键词: 大,X光,COVID
BIMCV-COVID19
- 数据量: 1350+ X光片,150+ CTs,800诊断
- 关键词: 中等,CT, COVID
MosMedData Covid19
- 数据量: 1000+ CTs,COVID19患者
- 关键词: 大,CT, COVID, 分割
COVID-19 LUNG CT LESION SEGMENTATION CHALLENGE
- 数据量: 约250张胸部CT,带COVID-19病变注释
- 关键词: 中等,CT, COVID, 注释, 分割
MedSeg COVID-19 CT
- 数据量: 约100张分割的CT切片
- 关键词: 中等,CT, 分割, COVID
COVID-Chest XRay
- 数据量: 约150张X光片,持续更新
- 关键词: 中等,X光,COVID
BSTI COVID19
- 数据量: 持续更新,约60名患者,CT
- 关键词: 中等,CT, COVID
Narratives fMRI
- 数据量: 345名受试者,891功能扫描,27个不同长度的故事
- 关键词: 中等,fMRI
RICORD
- 数据量: 1000张X光片和240张CT,带注释
- 关键词: 大,CT, COVID, 分割
FIRE (Fundus Image Registration Dataset)
- 数据量: 129张视网膜图像
- 关键词: 小,视网膜
DRIVE: Digital Retinal Images for Vessel Extraction
- 数据量: 40张视网膜图像,带分割
- 关键词: 小,视网膜,分割
FLARE: Fast and Low GPU memory Abdominal oRgan sEgmentation
- 数据量: 500+ CT扫描,来自11+国家,腹部器官分割
- 关键词: 大,腹部,CT
ADNI
- 数据量: 多种成像(纵向MRI),遗传学,临床数据
- 关键词: 大,MRI, 遗传学, 临床
VISCERAL
- 数据量: 约120个图像体积(全身CT和MRI图像)
- 关键词: 中等,MRI, CT, 全身, 手动分割
Mindboggle
- 数据量: 101个手动标记的脑MRI
- 关键词: 中等,MRI, 脑, 手动分割
Cross-Sectional Multidomain Lexical Processing
- 数据量: 3000个脑扫描(T1w, bold, events)
- 关键词: 大,MRI, fMRI, 测试
Duke Breast Cancer Screening DBT
- 数据量: 5,060名患者的数字乳房断层合成图像
- 关键词: 大,断层合成,DBT, 乳房, 检测
CBIS-DDSM (Curated Breast Imaging Subset of DDSM)
- 数据量: 2600+扫描胶片乳腺摄影研究
- 关键词: 大,X光
Neuromorphometrics
- 数据量: 63个手动标记的脑扫描
- 关键词: 中等,MRI, 脑, 手动分割, 昂贵
Automatic Non-rigid Histological Image Registration
- 数据量: 挑战数据集,ISBI2019
7-Tesla rs-fMRI
- 数据量: 22名参与者,rs-fMRI
SpineWeb
- 数据量: 200+受试者,多个数据集(CTs, X光片, MRIs)
Whole-Heart and Great Vessel Segmentation from 3D Cardiovascular MRI in Congenital Heart Disease
- 数据量: 20个先天性心脏病的心脏MR图像
Longitudinal Neuroimaging in Children
- 数据量: 约50名儿童(约10岁),单次随访MRI, fMRI和评估
- 关键词: 中等,fMRI, 纵向
Longitudinal Neuroimaging on arithmetic processing in children
- 数据量: 3T fMRI,132名典型发育儿童,2个时间点,四个任务
- 关键词: 中等,fMRI, 纵向
Narratives
- 数据量: 听觉故事聆听fMRI数据集,约7年时间
- 关键词: 中等,fMRI
ATLAS: Anatomical Tracings of Lesions After Stroke
- 数据量: 229个T1加权MRI扫描(n=220),带病变分割
- 关键词: 中等,MRI, 分割
MITOS_WSI_CMC
- 数据量: 21张犬乳腺肿瘤全切片图像
- 关键词: 小,2D, 全切片成像
FeTA Dataset
- 数据量: 48个手动注释的子宫内胎儿MR
- 关键词: 小,MRI, 胎儿, 标签
SIMON
- 数据量: 单个志愿者,73次会议,约17年
- 关键词: 小,MRI, 纵向
BigBrain
- 数据量: 单个体积,组织学空间,100微米
- 关键词: 小,组织学,高分辨率,分割
100微米MRI of Human Brain
- 数据量: 单个体积,超高分辨率MRI数据集(100微米)
- 关键词: 小,MRI, 脑
Natural Scenes Dataset (CMRR initiative)
- 数据量: 8名受试者的大规模fMRI(40次会议,高采样,高分辨率)
- 关键词: 小,MRI, 脑, fMRI
Brain Catalogue
- 数据量: 不同动物的脑部MRI或脑部
- 关键词: 小,MRI, 脑, 动物
Multishell diffusion
- 数据量: 三名健康旅行成人的扩散MRI
- 关键词: 小,MRI, 扩散, 脑
Pre-Natal MRI
- 数据量: 产前脑MRI样本(似乎是单个受试者?)
- 关键词: 小,MRI, 胎儿
BCNB: Early Breast Cancer Core-Needle Biopsy WSI Dataset
- 数据量: 1058张全切片图像(WSIs),相应的临床特征
- 关键词: 大,乳腺癌,多模态,WSI, 临床特征
BCI: Breast Cancer Immunohistochemical Image Generation Dataset
- 数据量: 4870对注册的HE-IHC图像对,覆盖HER2的四个表达水平(0, 1+, 2+, 3+)
- 关键词: 大,乳腺癌,HE, IHC
非成像数据集
PhysioNet / Pulmonary Edema Severity Grades Based on MIMIC-CXR
- 数据量: 基于MIMIC-CXR的数据集,包含3个元数据文件,包含肺水肿严重程度等级
- 关键词: 肺水肿,严重程度等级,胸片,放射学报告,MIMIC-CXR
PhysioNet / Computing in Cardiology 2019 Challenge
- 数据量: 预测ICU人群中的败血症
- 关键词: 败血症,ICU,预测
eICU-CRD
- 数据量: 超过200,000次入院,200多家美国医院的详细重症监护信息
- 关键词: 大,ICU,临床数据
非医学但有用/有趣的数据集
Moment in time
- 数据量: 时间点数据集
其他列表或资源池
Giorgos Sfikas: medical imaging datasets
- 数据量: 医学成像数据集列表
Andy Beam: medical data
- 数据量: 医学数据列表
Christopher Madan: openMorph
- 数据量: 开放访问MRI,结构良好的列表
Stephen Aylwards list of open-Access Medical Image Repositories
- 数据量: 开放访问医学图像存储库列表
google dataset search
- 数据量: 数据集搜索工具
grand-challenges
- 数据量: 挑战平台
academic torrents
- 数据量: 学术种子
multiBrain
- 数据量: 多脑数据集
openneuro
- 数据量: 开放神经数据
The Cancer Image Archive
- 数据量: 癌症图像存档
Cornell Public Image Databases
- 数据量: 公共图像数据库列表

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
yolo-datasets
深度学习目标检测数据集/分割数据集最全最完整的数据集集合,包含电力电气领域、航空影像输电线路与输电塔分割、电力遥感风力发电机、安全带和安全绳检测、变压器漏油故障诊断、高压输电线故障检测、光伏热红外缺陷、风电光伏功率数据、变电站火灾、输电线路语义分割、配网缺陷检测、变电站设备目标检测、太阳能光伏电池板缺陷、pcb电路板检测、绝缘体检测、输电线路防震锤缺陷、电线冰雪覆盖、电力工程电网施工现场安全作业、螺丝识别检测、变电站电力设备的可见光和红外图像、无人机航拍输电线路悬垂线夹、电线线路表面损害、氧化锌避雷器破损识别、热斑光伏发电系统红外热图像等多个领域的数据集。
github 收录
