“启真”医学知识数据
收藏浙江省数据知识产权登记平台2024-04-17 更新2024-05-08 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/32526
下载链接
链接失效反馈官方服务:
资源简介:
本数据对医疗场景中的决策具有重要指导意义,使得决策更加科学、更加符合医疗行业的规范,可作为医疗场景中人机交互的逻辑依据。本数据经过专家医生团队校验认证,具有权威性,数据范围包括疾病、药品、检查检验、手术、诊疗决策路径、健康宣教等。本数据可用于医疗人工智能产品的模型训练,例如临床辅助决策系统、医疗相关的大语言模型等产品的模型训练,经过本数据训练的模型能提供更加专业的建议结果。从医学权威机构官方渠道获取原始数据后,使用自然语言处理(NLP)从大量的医学文本数据中自动识别、抽取和整合有用的信息。首先,对原始文本进行预处理,包括分词(将句子分割成单词)、去除停用词(如“的”、“是”等无实际含义的词语)以及词干化(将单词还原为其词干形式),以减少数据噪音,使得文本更易于处理。然后,通过命名实体识别(Named Entity Recognition,NER)技术识别文本中的特定实体,如疾病、症状、药物、治疗方法等。其次,通过关系抽取技术从文本中提取实体之间的关系,如“疾病A可以通过药物B治疗”。通过以上算法规则初步得到了结构化的医学知识数据,然后通过医生专家团队的审核、校验及认证,形成高质量可用的医学知识数据。
提供机构:
浙江网新健康科技有限公司,浙江大学
创建时间:
2024-01-23
搜集汇总
数据集介绍

特点
“启真”医学知识数据是一个包含2001条医学知识的数据集,每年更新一次,适用于医疗人工智能产品的模型训练。数据经过自然语言处理技术和医生专家团队的审核,具有权威性和高质量。
以上内容由遇见数据集搜集并总结生成



