five

ade-benchmark-corpus/ade_corpus_v2

收藏
Hugging Face2024-01-09 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/ade-benchmark-corpus/ade_corpus_v2
下载链接
链接失效反馈
官方服务:
资源简介:
ADE-Corpus-V2数据集是一个用于药物不良反应(ADE)相关句子分类和关系抽取的数据集。该数据集包含三个配置:Ade_corpus_v2_classification用于判断句子是否与药物不良反应相关(相关或不相关),Ade_corpus_v2_drug_ade_relation用于提取药物与不良反应之间的关系,Ade_corpus_v2_drug_dosage_relation用于提取药物与剂量之间的关系。数据集的语言为英语,规模在10K到100K之间。

The ADE-Corpus-V2 dataset is a benchmark dataset for adverse drug reaction (ADE)-related sentence classification and relation extraction. It includes three configurations: Ade_corpus_v2_classification, which is used to determine whether a sentence is related to adverse drug reactions (related or unrelated); Ade_corpus_v2_drug_ade_relation, dedicated to extracting the relational pairs between drugs and adverse reactions; and Ade_corpus_v2_drug_dosage_relation, which is designed to extract the relational pairs between drugs and their dosages. The dataset is compiled in English, with a corpus size ranging from 10K to 100K instances.
提供机构:
ade-benchmark-corpus
原始信息汇总

数据集卡片 - Adverse Drug Reaction Data v2

数据集描述

数据集摘要

ADE-Corpus-V2 数据集:不良药物反应数据。该数据集用于分类句子是否与不良药物反应(ADE)相关(True)或不相关(False),以及提取不良药物事件与药物之间的关系。

  • DRUG-AE.rel 提供药物与不良反应之间的关系。
  • DRUG-DOSE.rel 提供药物与剂量之间的关系。
  • ADE-NEG.txt 提供ADE语料库中不包含任何药物相关不良反应的所有句子。

支持的任务和排行榜

情感分类,关系提取

语言

英语

数据集结构

数据实例

配置 - Ade_corpus_v2_classification

json { "label": 1, "text": "Intravenous azithromycin-induced ototoxicity." }

配置 - Ade_corpus_v2_drug_ade_relation

json { "drug": "azithromycin", "effect": "ototoxicity", "indexes": { "drug": { "end_char": [24], "start_char": [12] }, "effect": { "end_char": [44], "start_char": [33] } }, "text": "Intravenous azithromycin-induced ototoxicity." }

配置 - Ade_corpus_v2_drug_dosage_relation

json { "dosage": "4 times per day", "drug": "insulin", "indexes": { "dosage": { "end_char": [56], "start_char": [41] }, "drug": { "end_char": [40], "start_char": [33] } }, "text": "She continued to receive regular insulin 4 times per day over the following 3 years with only occasional hives." }

数据字段

配置 - Ade_corpus_v2_classification

  • text - 输入文本。
  • label - 是否与不良药物反应(ADE)相关(1)或不相关(0)。

配置 - Ade_corpus_v2_drug_ade_relation

  • text - 输入文本。
  • drug - 药物名称。
  • effect - 药物引起的效果。
  • indexes.drug.start_char - 文本中药物字符串的起始索引。
  • indexes.drug.end_char - 文本中药物字符串的结束索引。
  • indexes.effect.start_char - 文本中效果字符串的起始索引。
  • indexes.effect.end_char - 文本中效果字符串的结束索引。

配置 - Ade_corpus_v2_drug_dosage_relation

  • text - 输入文本。
  • drug - 药物名称。
  • dosage - 药物剂量。
  • indexes.drug.start_char - 文本中药物字符串的起始索引。
  • indexes.drug.end_char - 文本中药物字符串的结束索引。
  • indexes.dosage.start_char - 文本中剂量字符串的起始索引。
  • indexes.dosage.end_char - 文本中剂量字符串的结束索引。

数据分割

训练集
23516
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ADE Corpus V2是一个专注于药物不良反应研究的英文文本数据集,包含分类和关系抽取任务,总规模约3万条数据。该数据集可用于判断句子是否包含药物不良反应信息,以及提取药物与不良反应、药物与剂量之间的关系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作