bigbio/n2c2_2018_track2

Name: bigbio/n2c2_2018_track2
Creator: bigbio
Published: 2022-12-22 15:46:01
License: 暂无描述

Hugging Face2022-12-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/bigbio/n2c2_2018_track2

下载链接

链接失效反馈

官方服务：

资源简介：

n2c2 2018 ADE数据集是2018年国家NLP临床挑战赛（n2c2）的一部分，专注于从临床叙述中提取药物信息及其签名信息，以及药物不良反应（ADEs）。ADEs包括过敏反应、药物相互作用、过量用药和用药错误等。数据集的任务分为三个步骤：概念提取、关系分类和端到端系统构建。这些任务旨在帮助研究人员识别和预防ADEs，从而提高医疗服务的质量和安全性。

The n2c2 2018 ADE Dataset is part of the 2018 National NLP Clinical Challenges (n2c2), focusing on extracting medication information and their signature details, as well as adverse drug reactions (ADEs) from clinical narratives. ADEs include allergic reactions, drug-drug interactions, medication overdoses, medication errors and other related adverse events. The tasks of this dataset are divided into three steps: concept extraction, relation classification and end-to-end system construction. These tasks are designed to help researchers identify and prevent ADEs, so as to improve the quality and safety of medical services.

提供机构：

bigbio

原始信息汇总

数据集概述：n2c2 2018 ADE

基本信息

语言: 英语
许可证: 其他（DUA）
多语言性: 单语
数据集名称: n2c2 2018 ADE
主页: https://portal.dbmi.hms.harvard.edu/projects/n2c2-nlp/
是否公开: 否
是否可在PubMed上找到: 否

任务描述

任务类型:
- 命名实体识别（NER）
- 关系抽取（RE）

数据集详情

背景: 该数据集是2018年国家NLP临床挑战赛（n2c2）的一部分，专注于从临床叙述中提取药物信息及其特征信息和不良药物事件（ADEs）。
目标: 识别与药物相关的概念，如药物、其特征信息和ADEs，并通过关系分类链接这些概念与药物，以及构建能够从原始叙述文本中发现概念并找到这些概念与药物之间关系的端到端系统。
应用: 通过识别潜在的药物相互作用、过量、过敏和错误，以及在护理点提醒护理人员潜在的ADEs，可以改善医疗服务，降低ADEs的风险，并改善健康结果。

引用信息

@article{DBLP:journals/jamia/HenryBFSU20, author = {Sam Henry and Kevin Buchan and Michele Filannino and Amber Stubbs and Ozlem Uzuner}, title = {2018 n2c2 shared task on adverse drug events and medication extraction in electronic health records}, journal = {J. Am. Medical Informatics Assoc.}, volume = {27}, number = {1}, pages = {3--12}, year = {2020}, url = {https://doi.org/10.1093/jamia/ocz166}, doi = {10.1093/jamia/ocz166}, timestamp = {Sat, 30 May 2020 19:53:56 +0200}, biburl = {https://dblp.org/rec/journals/jamia/HenryBFSU20.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }

搜集汇总

数据集介绍

构建方式

n2c2 2018 ADE数据集是在2018年举办的National NLP Clinical Challenges竞赛的Track 2任务中构建的，旨在从临床叙事中提取药物及其标志性信息以及不良药物事件（ADEs）。该数据集的构建分为三个任务步骤：概念提取、关系分类和端到端系统构建。概念提取任务识别与药物、药物信息和ADEs相关的概念；关系分类任务则将这些概念与药物通过识别金标准概念上的关系相连接；端到端系统任务则是处理原始叙事文本以发现概念并找出这些概念与药物之间的关系。

特点

n2c2 2018 ADE数据集的特点在于聚焦于药物及其不良事件的自然语言处理任务，特别强调ADEs的识别。数据集的构建不仅包括药物信息的提取，还涉及药物相关不良事件的记录，这对于提高医疗保健质量和减少ADEs风险具有重要意义。此外，该数据集通过共享任务的方式，促进了不同系统在同一任务和相同数据上的直接比较，有助于研究人员识别特定任务的最先进技术，并在此基础上进行学习和构建。

使用方法

使用n2c2 2018 ADE数据集，研究人员可以开展药物及其不良事件提取相关的自然语言处理研究。数据集的利用通常涉及对三个任务的参与：概念提取、关系分类和端到端系统的构建。用户首先需要识别临床文本中的关键概念，然后确定这些概念与药物之间的关系，最终目标是开发能够自动处理原始临床文本并提取相关信息的系统。该数据集的使用有助于推动医学信息学领域的研究，并有助于提高对不良药物事件的监测和预防能力。

背景与挑战

背景概述

在自然语言处理与医疗信息学交叉领域，n2c2 2018 ADE数据集应运而生，旨在推进药物及其不良反应（ADEs）从临床叙事中的提取研究。该数据集由哈佛大学医学院的生物医学信息学部门于2018年发起，继承了自2006年以来i2b2挑战赛的传统，并增添了新的任务数据集。n2c2 2018 ADE聚焦于从电子健康记录中识别药物相关概念及其签名信息，以及ADEs，对于改善医疗保健质量、降低ADEs风险具有重要意义。该数据集不仅推动了相关领域的研究进展，也为评估预防性医疗干预提供了重要资源。

当前挑战

n2c2 2018 ADE数据集面临的挑战主要在于，药物及其不良反应的提取涉及到复杂的医学术语和语境理解，任务分为概念提取、关系分类和端到端系统构建三个步骤。概念提取需准确识别药物相关概念，关系分类需建立概念与药物之间的关联，而端到端系统则需处理原始叙事文本以发现概念及其关系。这些任务对自然语言处理技术提出了较高的要求，且数据集的隐私性和专有性使得研究面临额外的障碍。

常用场景

经典使用场景

在生物医药领域，n2c2 2018 ADE数据集的运用尤为关键，其经典的使用场景在于从临床叙事中提取药物及其特征信息，以及不良反应事件（ADEs）。该数据集使得研究者能够训练模型，通过自然语言处理技术，对电子健康记录进行深入分析，以识别药物相关的关键概念和关系。

解决学术问题

该数据集解决了学术研究中如何有效识别和预防药物不良反应事件的问题，有助于降低医疗错误，改善患者健康结果。通过提供标注翔实的药物与ADEs相关数据，它使得研究者在命名实体识别和关系分类等任务上能够进行系统的性能比较，推动该领域的研究进展。

衍生相关工作

基于n2c2 2018 ADE数据集的研究衍生出了许多相关工作，包括构建更为精细化的药物安全监测系统，开发新的机器学习模型来预测和识别药物不良反应，以及将自然语言处理技术应用于更多类型的医疗数据分析，进一步拓展了医学信息学的研究领域。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集