five

bigbio/n2c2_2018_track1

收藏
Hugging Face2022-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/n2c2_2018_track1
下载链接
链接失效反馈
官方服务:
资源简介:
n2c2 2018 Selection Criteria数据集主要用于文本分类任务,特别是识别患者是否符合临床试验的选择标准。数据集包含202个带有文档级注释的患者记录和86个测试集记录。数据集的语言为英语,且不公开。数据集的选择标准包括13个具体标准,如药物滥用、酒精滥用、英语能力、医疗决策能力等。数据集的注释者间平均一致性为84.9%。

The n2c2 2018 Selection Criteria dataset is primarily developed for text classification tasks, particularly focused on identifying whether patients meet the inclusion criteria for clinical trials. The dataset consists of 202 patient records with document-level annotations and 86 test set records. It is in English and is not publicly available. The selection criteria encompass 13 specific items, including drug abuse, alcohol abuse, English proficiency, and medical decision-making capacity. The average inter-annotator agreement of this dataset is 84.9%.
提供机构:
bigbio
原始信息汇总

数据集卡片 for n2c2 2018 Selection Criteria

数据集描述

  • 主页: https://portal.dbmi.hms.harvard.edu/projects/n2c2-nlp/
  • 是否公开:
  • 任务类型: 文本分类

2018年国家NLP临床挑战赛共享任务的第一轨道聚焦于识别语料库中的患者是否符合特定的选择标准。该共享任务旨在确定NLP系统是否可以被训练来识别患者是否符合一组从实际临床试验中提取的选择标准。这些标准包括测量检测、推理、时间推理和专家判断。

最终选定的13个选择标准如下:

  1. DRUG-ABUSE: 当前或过去的药物滥用
  2. ALCOHOL-ABUSE: 当前酒精使用超过每周推荐限制
  3. ENGLISH: 患者必须说英语
  4. MAKES-DECISIONS: 患者必须做出自己的医疗决策
  5. ABDOMINAL: 历史上的腹腔手术、小肠或大肠切除或小肠梗阻
  6. MAJOR-DIABETES: 主要的糖尿病相关并发症
  7. ADVANCED-CAD: 高级心血管疾病(CAD)
  8. MI-6MOS: 过去6个月内的MI
  9. KETO-1YR: 过去一年内的酮症酸中毒诊断
  10. DIETSUPP-2MOS: 过去2个月内服用膳食补充剂(不包括维生素D)
  11. ASP-FOR-MI: 使用阿司匹林预防MI
  12. HBA1C: 任何6.5%到9.5%之间的HbA1c值
  13. CREATININE: 血清肌酐 > 正常上限

训练集包含202份患者记录,带有文档级注释,10份记录带有文本跨度指示注释者的证据,而测试集包含86份记录。

注意:

  • 注释者之间的平均一致性为84.9%
  • 10份带有文本跨度指示注释者证据的记录的位置未知。然而,作者进行了简单的脚本验证,确认训练集和测试集中的标签没有附带任何文本证据。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集用于训练NLP系统识别患者是否符合临床试验选择标准,包含13个标准,训练集202份记录,测试集86份,强调测量检测、推理、时序推理和专家判断能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作