MIMIC-IV|医疗健康数据数据集|心电图数据集
收藏MIMIC-IV 数据集概述
数据集简介
MIMIC-IV 是一个免费访问的电子健康记录(EHR)数据集,涵盖了2008年至2019年期间贝斯以色列女执事医疗中心的患者信息。该数据集超越了其前身 MIMIC-III,具有更好的结构和额外的患者信息。
数据来源
- 综合医院范围内的EHR系统
- ICU特定的临床信息系统
数据内容
- 生命体征
- 诊断
- 药物
- 程序
- 去识别化的临床笔记
数据特点
- 严格的去识别化程序确保患者隐私
- 包含约800,000个10秒的ECG记录,来自近160,000名独特患者
- 每个ECG使用12个导联,采样频率为500 Hz
研究目标
主要目标
- 评估 MIMIC-IV 数据库是否包含足够的连续ECG数据,以支持心脏衰竭患者心脏动态老化研究。
次要目标
- 分析每次住院期间ECG的时间安排。
- 通过ECG频率和住院次数可视化患者分布。
- 根据ECG数据描述研究协议的修改计划。
结论与计划
- MIMIC 数据库包含大量在不同生命阶段记录的连续ECG。
- 有6,400名患者的ECG显示记录之间的时间间隔超过一年。
- 可以分析心脏衰竭患者的衰老特征,尽管无法确定慢性疾病与衰老之间的因果关系。
可能的计划修改
- 分析心脏衰竭患者在一年的心脏特征变化,并将其与三年死亡率进行比较。
- 尽管无法确定因果关系,但这种方法可以提供关于心脏老化在该人群中如何进展的见解。

CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录