five

pankajrajdeo/MRCONSO_UMLS

收藏
Hugging Face2024-07-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/pankajrajdeo/MRCONSO_UMLS
下载链接
链接失效反馈
官方服务:
资源简介:
MRCONSO数据集是UMLS(统一医学语言系统)元数据的一部分,采用丰富发布格式(RRF)。该数据集包含概念名称及其来源,提供了与UMLS元数据中医学概念相关的各种名称和标识符的详细信息。它支持开发者和研究人员全面表示和利用医学术语。数据集的主要用途是支持医学信息学应用、临床决策支持系统和其他健康相关软件解决方案,帮助精确表示和理解医学术语及其标识符。

The MRCONSO data is a component of the UMLS (Unified Medical Language System) Metathesaurus, available in the Rich Release Format (RRF). This dataset contains concept names and their sources, offering a detailed resource for understanding the various names and identifiers associated with medical concepts within the UMLS Metathesaurus. It supports developers and researchers in comprehensively representing and utilizing medical terminology. The primary purpose of the MRCONSO dataset is to aid in medical informatics applications, clinical decision support systems, and other health-related software solutions by providing a structured representation of concept names, terms, and their sources.
提供机构:
pankajrajdeo
原始信息汇总

MRCONSO 数据集概述

数据集描述

数据集摘要

MRCONSO 数据集是 UMLS(统一医学语言系统)Metathesaurus 的一部分,以 Rich Release Format (RRF) 格式提供。该数据集包含概念名称及其来源,提供了与 UMLS Metathesaurus 中医疗概念相关的各种名称和标识符的详细资源。它支持开发者和研究人员全面表示和利用医学术语。

数据集用途

MRCONSO 数据集提供了概念名称、术语及其来源的结构化表示。这些信息对于医疗信息学应用、临床决策支持系统和其他健康相关软件解决方案至关重要,有助于精确表示和理解医学术语及其标识符。

列描述

CUI (Concept Unique Identifier)

  • 描述: UMLS Metathesaurus 中分配给每个概念的唯一标识符。
  • : 例如 C0001175,每个值唯一标识一个医学概念。

LAT (Language of Term)

  • 描述: 术语的语言。
  • : 例如 ENG 表示英语,FRE 表示法语。

TS (Term Status)

  • 描述: 术语的状态。
  • : 例如 P 表示首选术语状态,S 表示同义词状态。

LUI (Lexical Unique Identifier)

  • 描述: 术语的唯一标识符。
  • : 例如 L0001175,每个值唯一标识数据集中的一个术语。

STT (String Type)

  • 描述: 字符串的类型。
  • : 例如 PF 表示首选形式,VO 表示变体形式。

SUI (String Unique Identifier)

  • 描述: 字符串的唯一标识符。
  • : 例如 S0013742,每个值唯一标识数据集中的一个字符串。

ISPREF (Atom Status - Preferred)

  • 描述: 指示该原子是否为此概念的首选术语。
  • : 例如 Y 表示是(首选),N 表示否(非首选)。

AUI (Atom Unique Identifier)

  • 描述: 原子的唯一标识符,是源词汇中字符串的特定出现。
  • : 例如 A0019180,每个值唯一标识数据集中的一个原子。

SAUI (Source Asserted Atom Identifier)

  • 描述: 源提供的原子标识符(可选)。
  • : 例如 SA001,如果源未提供断言标识符,则该字段可能为空。

SCUI (Source Asserted Concept Identifier)

  • 描述: 源提供的概念标识符(可选)。
  • : 例如 SC0001,如果源未提供断言标识符,则该字段可能为空。

SDUI (Source Asserted Descriptor Identifier)

  • 描述: 源提供的描述符标识符(可选)。
  • : 例如 SD0001,如果源未提供断言标识符,则该字段可能为空。

SAB (Source Abbreviation)

  • 描述: 术语来源的缩写名称。
  • : 例如 MSHCSPNCI_NCI-GLOSS,每个值代表一个缩写的源名称。

TTY (Term Type)

  • 描述: 源词汇中术语类型的缩写。
  • : 例如 PN 表示 Metathesaurus 首选名称,CD 表示临床药物。

CODE

  • 描述: 最有用的源断言标识符,或 Metathesaurus 生成的源条目标识符。
  • : 例如 D000163,每个值代表一个源断言标识符或 Metathesaurus 生成的标识符。

STR (String)

  • 描述: 表示术语的字符串。
  • : 例如 "Acquired Immunodeficiency Syndrome",提供实际的术语或概念名称。

SRL (Source Restriction Level)

  • 描述: 源限制级别。
  • : 例如表示不同限制级别的 6 个可能值。

SUPPRESS (Suppressible Flag)

  • 描述: 指示术语的可抑制状态的标志。反映术语是否应在某些视图或使用中被抑制。
  • : 例如 OEY,或 N,这些值表示术语的可抑制状态。

CVF (Content View Flag)

  • 描述: 用于标记包含在内容视图中的行的位字段。此字段是一个 varchar 字段,以最大化可用位数。
  • : 用于标记特定行以供内容视图使用的字符串。

示例记录

CUI: C0001175 LAT: ENG TS: P LUI: L0001175 STT: PF SUI: S0013742 ISPREF: Y AUI: A0019180 SAUI: (empty) SCUI: (empty) SDUI: (empty) SAB: MSH TTY: PN CODE: D000163 STR: Acquired Immunodeficiency Syndrome SRL: 0 SUPPRESS: N CVF: 0

使用

该数据集主要面向从事医疗信息学应用的开发者和研究人员。它可以用于确保对医学术语及其标识符的准确和全面理解,支持临床决策,并增强健康信息系统。

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作