上海交通大学医学院结构化医疗数据库
收藏国家基础学科公共科学数据中心2026-05-20 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6a0b37c4f175603f068f83e6&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据库针对基于微小型数据中心的智能诊疗服务场景构建,核心目标是建立标准化、可复用、资源聚合、地理位置分散的“多对多”结构化医疗数据集合,为临床研究中的病例分析、治疗方案疗效评估及临床医疗决策优化提供高质量数据支撑,填补微小型医疗数据中心在标准化医疗数据储备方面的应用空白。该结构化医疗数据库全面覆盖智能诊疗服务所需的核心数据维度,通过结构化表格形式精准记录医疗全流程信息,出于保护患者隐私的考虑,数据库中隐去了患者的姓名、身份ID等信息。数据库共记录585721条病例条目,每个条目包含患者的一条病例记录,主要包括患者基本信息模块和诊断记录模块。患者基本信息模块通过包含患者检查流水号(同一批次检查使用相同流水号)、性别(取值为“男/女”,无空值)、年龄(按“岁”为单位记录,范围18-85岁)就诊科室(覆盖内科、外科、妇产科等8个临床科室)等字段,无关键字段缺失。诊断记录模块包含患者检查描述(文本型数据,描述患者检查结果)和检查结论(结构化文本,记录根据检查结果得出的病情初步诊断结论)。数据采集环境为上海交通大学医院医疗数据中心,该中心由1台数据管理服务器、2台存储服务器(总存储容量10TB)、3台应用服务器及临床终端构成,通过10Gbps以太网互联,配套医疗数据安全管理系统(符合《数据安全法》及《医疗数据安全指南》要求)。数据采集采用医院电子病历系统(EMR)与自主开发的医疗数据结构化提取工具联动方式,从系统导出原始医疗记录,通过结构化工具自动匹配至对应数据库字段,采集过程中由2名临床医师对数据准确性进行双重核验(核验通过率98.2%,1.8%误差数据已修正)。数据采集时间范围为2021年10月16日至2024年8月20日,采集频率与患者就诊及随访周期同步(就诊数据实时采集,随访数据按计划周期采集),确保数据能反映不同季节、不同疾病周期的诊疗特征,具备时间维度上的代表性。
提供机构:
上海交通大学



