ManpreetK/NDD_NER
收藏Hugging Face2022-12-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ManpreetK/NDD_NER
下载链接
链接失效反馈官方服务:
资源简介:
该命名实体识别数据集专为神经发育障碍领域设计,用于检测特定领域的实体。数据集最初通过SciSpaCy UMLS实体链接器对PubMed摘要进行注释,并将特定的语义类型映射到所需的领域特定标签,随后使用Label Studio进行手动验证。数据集包含训练集、验证集和测试集,分别包含341、177和160个样本。数据集的标签类别包括CONDITION、ASSOCIATED_PROBLEM、PATIENT_GROUP、INTERVENTION和TEST,每个类别对应不同的UMLS语义类型。
提供机构:
ManpreetK
原始信息汇总
数据集概述
数据集名称
NDD_NER
数据集描述
这是一个用于神经发育障碍领域的命名实体识别(NER)数据集,旨在识别特定领域的实体。数据集通过SciSpaCy UMLS实体链接器对PubMed摘要进行标注,并将特定的语义类型映射到所需的领域特定标签,随后通过Label Studio进行手动校验。
数据集特征
- tokens: 字符串序列
- ner_tags: 标签序列,包含以下类别:
- I-CONDITION
- I-TEST
- B-CONDITION
- I-PATIENT_GROUP
- B-ASSOCIATED_PROBLEM
- O
- I-ASSOCIATED_PROBLEM
- B-INTERVENTION
- B-PATIENT_GROUP
- I-INTERVENTION
- B-TEST
数据集分割
- train: 341个样本,大小156151字节
- validation: 177个样本,大小68495字节
- test: 160个样本,大小67949字节
数据集大小
- 下载大小: 78315字节
- 数据集总大小: 292595字节
标签类别及UMLS语义类型
- CONDITION: Mental or Behavioral Dysfunction, Disease or Syndrome, Neoplastic Process, Congenital Abnormality
- ASSOCIATED_PROBLEM: Sign or Symptom, Mental Process, Injury or Poisoning
- PATIENT_GROUP: Age Group, Population Group, Patient or Disabled Group
- INTERVENTION: Therapeutic or Preventive Procedure, Health Care Activity
- TEST: Diagnostic Procedure, Intellectual Product, Research Activity, Laboratory Procedure
数据集分割详情
| 分割名称 | 样本数 | CONDITION | ASSOCIATED_PROBLEM | PATIENT_GROUP | INTERVENTION | TEST |
|---|---|---|---|---|---|---|
| train | 341 | 320 | 189 | 240 | 273 | 228 |
| test | 160 | 139 | 68 | 87 | 98 | 82 |
| validation | 177 | 147 | 82 | 104 | 117 | 98 |



