five

支持卫生健康数据要素定义及规则推理的知识图谱

收藏
国家基础学科公共科学数据中心2026-01-24 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69739b17195d264c7416b4a9&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集来源于医学知识抽取与图谱构建科研项目,旨在整合临床医学、药学及检验学等多领域知识资源,构建系统化、可计算的医学知识图谱。数据主要基于公开医学文献、权威数据库及结构化医疗资料,通过大语言模型驱动的命名实体识别与关系抽取方法生成。其内容涵盖疾病、症状、病因、治疗、药物、并发症等核心医学概念及其关联关系,形成完整的实体与关系网络。本数据集文件均为CSV格式,由3个文件组成。其中data.csv文件为知识图谱三元组信息,采用整数编号形式对实体与关系进行统一编码。entity_dict.csv和relation_dict.csv分别为实体与关系的数据词典,提供实数据索引id与数据内容的对照。数据内容以三元组结构存储,用于表示知识图谱中实体与实体之间的关联关系,数据总量包含216,775,940条三元组记录,其中包含26,325例推理规则,文件合计大小为15.31G。
提供机构:
东软集团股份有限公司
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个支持卫生健康数据要素定义及规则推理的知识图谱,来源于医学知识抽取项目,整合了临床医学、药学和检验学等多领域知识。它包含疾病、症状、病因等核心医学概念及其关联关系,以CSV格式存储,由3个文件组成,总计216,775,940条三元组记录和26,325例推理规则,文件大小为15.31G。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务