近视防控临床诊疗和医疗资源数据

Name: 近视防控临床诊疗和医疗资源数据
Creator: 温州医科大学附属眼视光医院
Published: 2026-04-23 08:44:41
License: 暂无描述

浙江省数据知识产权登记平台2026-04-23 更新2026-04-24 收录

下载链接：

https://www.zjip.org.cn/home/announce/trends/8438582

下载链接

链接失效反馈

官方服务：

资源简介：

当前，全球近视患病率高发，已成为重大公共卫生问题。<<近视防治指南(2024年版)>>显示，我国近视患病率达53.6%，高度近视患者占比显著增加，是不可逆性致盲主因之一。现有防控手段难以满足精准防控需求，相关研究缺乏对近视患者人群特征、诊疗模式、医疗资源利用的系统性刻画，标准化近视数据集的建设，正是破解上述困境的核心抓手。本项目整合近视患者诊疗和医疗资源利用情况的数据，包含：人口学信息、就诊信息、诊断信息、病例信息、生命体征信息、眼科检查信息、药品医嘱信息、非药品医嘱信息。对繁杂无序的诊疗数据开展匿名化、标准化、结构化处理，转化为可直接用于分析的标准化数据集。基于高质量数据集，可针对疾病精准诊断、药械疗效量化评估、行业发展趋势研判等关键方向，开展科学系统的预测分析，为临床研究、公共卫生政策制定及眼视光产品开发等提供支撑。数据说明：原始数据为公共数据，经政府授权运营，数据可用不可见。包含近视患者人口学、就诊、诊断、病历、生命体征、眼科检查、药品医嘱、非药品医嘱8类信息，覆盖基础信息、诊疗全流程记录及医疗资源使用相关数据。处理规则：数据处理平台为政府牵头建设的公共数据授权运营域，域内数据已根据相应脱敏规则进行匿名化、去标识化处理。项目将不同类型数据按照对应患者序号进行关联清洗，对患者序号进行编号处理，生成自增的序号。形成包括92个字段的数据集，其中通过数据标准化处理的字段有33个（AO-AQ、AT-BA、BC-BM、BS-CC列）；另有17个字段（D、Y-AN列）是利用自然语言处理、机器学习、AI大模型技术通过患者的诊断、主诉、现病史、专科检查、辅助检查得出患者结构化字段，例如是否有过敏性结膜炎等结果。技术实施流程核心分为两部分：第一部分：需标准化的字段，针对每一个字段根据实际数据情况制定标准化的规则，如身高，对原始数据中的厘米、米、cm、m统一为m；第二部分：从文本中结构化字段，分两步。一是文本预处理，对临床文本进行去噪、分词、词性标注及实体识别，筛选出与眼部症状、体征相关的核心词汇，如“瘙痒”“畏光”等；二是结构化推理与输出，依托已训练完成的模型，结合NLP（自然语言处理技术）的语义关联分析能力及AI大模型（适用于医学领域的自研大模型，在中文医学AI大模型领域公开评测中多次位列第一）对临床文本上下文语义的精准捕捉能力，有效规避歧义文本干扰，直接通过模型推理判断各目标字段的“是/否”属性，最终形成标准化的结构化数据。示例：针对“是否有过敏性结膜炎”字段的提取。模型首先从临床文本中识别关键线索，若主诉包含“眼部瘙痒、反复发作”，现病史提及“接触花粉后症状加重”，专科检查记录“眼睑结膜滤泡增生、结膜充血”，辅助检查提示“血清IgE升高”，结合NLP语义关联分析，AI大模型可精准匹配过敏性结膜炎的典型特征，最终输出该字段结果为“是”；若文本中无上述相关特征，且未提及过敏性结膜炎相关诊断，则输出“否”。数据内容：转换后形成标准化结构化数据集，标准化涵盖统一眼轴长度、散光轴向等指标单位与范围，结构化则将非结构化的病例主诉、现病史等文本信息拆解为可统计分析的字段，最终包含患者基线特征、合并症状、用药情况、眼科检查结果、治疗方式等核心内容，为后续场景应用提供高质量数据支持。

提供机构：

温州医科大学附属眼视光医院

创建时间：

2026-01-14

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集整合了近视患者的临床诊疗与医疗资源利用数据，涵盖人口学、就诊、诊断、病历、眼科检查及药品/非药品医嘱等92个字段、共10000条记录。数据经匿名化、标准化和结构化处理，并利用NLP与AI大模型技术从非结构化文本中提取关键症状信息，可用于近视精准诊断、药械疗效量化评估及公共卫生政策制定等研究场景。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集