five

pankajrajdeo/MRMAP_UMLS

收藏
Hugging Face2024-07-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/pankajrajdeo/MRMAP_UMLS
下载链接
链接失效反馈
官方服务:
资源简介:
MRMAP数据集是UMLS(统一医学语言系统)元数据的一部分,采用丰富发布格式(RRF)。该数据集包含不同医学词汇之间的映射信息,为理解医学概念在各种术语中的关系和映射提供了详细的资源。它支持开发者和研究人员全面表示和利用医学术语映射。

The MRMAP data is a component of the UMLS (Unified Medical Language System) Metathesaurus, available in the Rich Release Format (RRF). This dataset contains mapping information between different medical vocabularies, providing a detailed resource for understanding the relationships and mappings of medical concepts across various terminologies.
提供机构:
pankajrajdeo
原始信息汇总

MRMAP 数据集概述

数据集描述

数据集摘要

MRMAP 数据集是 UMLS(统一医学语言系统)Metathesaurus 的一部分,以 Rich Release Format (RRF) 格式提供。该数据集包含不同医学词汇之间的映射信息,为理解和分析医学概念在不同术语中的关系提供了详细资源。它支持开发者和研究人员全面表示和利用医学术语映射。

用途

MRMAP 数据集提供了医学词汇之间映射的结构化表示。这些信息对于医学信息学应用、临床决策支持系统和其他健康相关软件解决方案至关重要,有助于精确表示和理解医学术语及其相互关系。

列描述

MAPSETCUI (Map Set Concept Unique Identifier)

  • 描述: 表示整个映射集的 UMLS 概念的唯一标识符。
  • : 如 C0001175 的字母数字字符串,用于唯一标识映射集概念。

MAPSETSAB (Map Set Source Abbreviation)

  • 描述: 映射集提供者的源缩写。
  • : 如 MSH, SNOMEDCT 的字母数字字符串,最大长度为 8 个字符。

MAPSUBSETID (Map Subset Identifier)

  • 描述: 用于标识映射集内相关映射子集的标识符(可选)。
  • : 如 SUB001 的字母数字字符串,最大长度为 7 个字符。

MAPRANK (Map Rank)

  • 描述: 子集中映射应应用的顺序(可选)。
  • : 如 RANK001 的字母数字字符串,最大长度为 20 个字符。

MAPID (Map Identifier)

  • 描述: 单个映射的唯一标识符,表的主键。
  • : 如 MAP0001 的字母数字字符串,长度可变。

MAPSID (Source Asserted Map Identifier)

  • 描述: 此映射的源断言标识符(可选)。
  • : 如 SID0001 的字母数字字符串,最大长度为 121 个字符。

FROMID (From Identifier)

  • 描述: 被映射实体的标识符。
  • : 如 FROM0001 的字母数字字符串,长度可变。

FROMSID (Source Asserted Identifier for From Entity)

  • 描述: 被映射实体的源断言标识符(可选)。
  • : 如 SID0001 的字母数字字符串,长度可变。

FROMTYPE (From Type)

  • 描述: 被映射实体的类型。
  • : 如 CUI, AUI, CODE 的字母数字字符串,最大长度为 3 个字符。

REL (Relationship)

  • 描述: 被映射实体与被映射到实体之间的关系。
  • : 如 SY, RB, RN 的字母数字字符串,最大长度为 7 个字符。

RELA (Additional Relationship Label)

  • 描述: 附加关系标签(可选)。
  • : 如 mapped_to 的字母数字字符串,最大长度为 5 个字符。

TOID (To Identifier)

  • 描述: 被映射到实体的标识符。
  • : 如 TO0001 的字母数字字符串,长度可变。

TOEXPR (To Expression)

  • 描述: 被映射到的实体,可以是单个代码/标识符/概念名称或涉及多个代码/标识符/概念名称、布尔运算符和/或标点符号的复杂表达式。
  • : 如 TOEXPR001 的字母数字字符串,长度可变。

TOTYPE (To Type)

  • 描述: 被映射到实体的类型。
  • : 如 CUI, AUI, CODE 的字母数字字符串,最大长度为 5 个字符。

TORULE (To Rule)

  • 描述: 适用于被映射到实体的可机处理规则(可选)。
  • : 如 RULE001 的字母数字字符串,长度可变。

TORES (To Restriction)

  • 描述: 适用于被映射到实体的限制(可选)。
  • : 如 RES001 的字母数字字符串,长度可变。

MAPTYPE (Map Type)

  • 描述: 映射类型(可选)。
  • : 如 EXACT, NARROW, BROAD 的字母数字字符串,最大长度为 6 个字符。

MAPRULE (Map Rule)

  • 描述: 适用于此映射的可机处理规则(可选)。
  • : 如 R 的字母数字字符串,最大长度为 1 个字符。

MAPRES (Map Restriction)

  • 描述: 适用于此映射的限制(可选)。
  • : 如 RES001 的字母数字字符串,长度可变。

示例记录

MAPSETCUI: C0001175 MAPSETSAB: MSH MAPSUBSETID: SUB001 MAPRANK: RANK001 MAPID: MAP0001 MAPSID: SID0001 FROMID: FROM0001 FROMSID: SID0001 FROMTYPE: CUI REL: SY RELA: mapped_to TOID: TO0001 TOEXPR: TOEXPR001 TOTYPE: CUI TORULE: RULE001 TORES: RES001 MAPTYPE: EXACT MAPRULE: R MAPRES: RES001

使用

该数据集主要面向从事医学信息学应用的开发者和研究人员。它可以用于确保医学术语及其映射的准确和全面理解,支持临床决策,并增强健康信息系统。

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作