five

融合国际标准的医学语言系统的知识库

收藏
国家基础学科公共科学数据中心2026-01-24 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69739b16195d264c7416b4a7&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集面向卫生健康领域医学语言体系不统一、术语标准差异导致的数据互通与共享障碍,围绕医学语言标准化与语义一致性需求,构建了一个大规模、跨标准的医学语言资源体系。本数据集文件均为CSV格式,由3个文件组成。其中data.csv文件为知识图谱三元组信息,采用整数编号形式对实体与关系进行统一编码。entity_dict.csv和relation_dict.csv分别为实体与关系的数据词典,提供实数据索引id与数据内容的对照。数据内容以三元组结构存储,用于表示知识图谱中医学概念术语的关联关系,数据总量包含12,853,046例医学概念和188,848,003条三元组记录,文件合计大小为13.3G。
提供机构:
东软集团股份有限公司
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集旨在应对卫生健康领域医学语言体系不统一和术语标准差异带来的数据互通挑战,构建了一个融合国际标准的大规模医学语言资源体系。它以CSV格式存储,包含3个文件,提供知识图谱三元组信息以及实体与关系的词典,共涵盖超过1285万例医学概念和约1.89亿条三元组记录,总文件大小约为13.3G。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务