MIMIC-IV数据库|重症医学数据集|医疗信息数据集
收藏MIMIC-IV数据库汉化项目概述
项目背景
- 项目旨在汉化MIMIC-IV数据库的说明文档,助力临床研究。
- 默认用户已获得MIMIC数据库使用权限及CIIT官方认证。
MIMIC数据库介绍
- 全称:Medical Information Mart for Intensive Care(重症医学数据库)。
- 建立机构:贝斯以色列女执事医疗中心、麻省理工、牛津大学、麻省总医院。
- 用途:广泛应用于科研项目。
汉化内容
- 英文版说明文档汉化。
- 说明文档汉化。
- ICD版本汉化(ICD-9和ICD-10)。
文档版本
- 背景介绍:英文原版、中英文混合版、中文翻译版。
- 说明文档:英文版、中英文混合版、中文版。
- ICD诊断代码手册:ICD-9和ICD-10的中英对照汉化版。
- ICD操作代码:ICD-9操作代码汉化版、ICD-10操作代码中英对照汉化版。
- 化验检查ID对照字典:中英对照版。
参与人员
- 刘鑫源:青岛大学医学部,医学硕士。
- 白洪翔:知右传感技术(上海)有限公司,软件工程师。
通信方式
- 邮箱:17386506353@189.cn
- QQ群:934942955
- 需求收集文档:https://docs.qq.com/aio/DSEJaZHRyUU1zZklI
官方资源
- MIMIC-IV官网:https://physionet.org/content/mimiciv/3.1/
- 安装教程:https://mimic.mit.edu/docs/
- 本地安装文件:https://github.com/MIT-LCP/mimic-code/
- 使用教程:https://mimic.mit.edu/docs/iv/
- 申请步骤教程:https://physionet.org/content/mimiciv/view-required-training/3.1/#1
- 伦理审批网站:https://about.citiprogram.org/
软件准备
- PostgreSQL数据库16.0版本及以上。
- 官网下载:https://www.postgresql.org/download/
运行环境
- Windows 10, 64位。
- Windows 11, 64位。
捐赠方式
- 支付宝:见项目详情页。
- 银行账户:知右传感技术(上海)有限公司。

Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
ner_training_stanza
该数据集包含文本数据及其相应的命名实体识别信息。文本被分词,并且命名实体识别信息既包括词级别也包括字符级别。数据集分为训练集、验证集和测试集,适用于进一步的自然语言处理任务。
huggingface 收录
emotions-dataset
情绪数据集是一个精心策划的文本数据集,包含131,306个文本条目,标注了13种不同的情绪,如快乐、悲伤、中性、愤怒等。该数据集旨在提升情感分类、情感分析和自然语言处理的能力,适用于构建富有同情心的聊天机器人、心理健康工具、社交媒体分析器等。数据集文件大小为7.41MB,便于在边缘设备和大型项目中使用。
huggingface 收录
Paper III (Walker et al. 2024)
Data products used in 3-D CMZ Paper III, Walker et al. (2024). The full cloud catalogue is provided in tabular format, along with a full CMZ map showing the clouds and their assigned IDs. For each cloud ID in the published catalogue there are: - Individual cube cutouts from the MOPRA 3mm CMZ survey (HC3N, HCN, and HNCO). - Individual cube cutouts from the APEX 1mm CMZ survey (13CO, C18O, and H2CO). - Cloud-averaged spectra of the ATCA H2CO 4.83 GHz line. - PV slices of the ATCA H2CO 4.83 GHz line, taken across the major axis of the source. - Where applicable, there are mask files which correspond to the different velocity components of the cloud. In these cases, there are two mask files per velocity component, corresponding to the different masking approaches described in the paper.
DataCite Commons 收录
