ade-benchmark-corpus/ade_corpus_v2
收藏Hugging Face2024-01-09 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/ade-benchmark-corpus/ade_corpus_v2
下载链接
链接失效反馈官方服务:
资源简介:
ADE-Corpus-V2数据集是一个用于药物不良反应(ADE)相关句子分类和关系抽取的数据集。该数据集包含三个配置:Ade_corpus_v2_classification用于判断句子是否与药物不良反应相关(相关或不相关),Ade_corpus_v2_drug_ade_relation用于提取药物与不良反应之间的关系,Ade_corpus_v2_drug_dosage_relation用于提取药物与剂量之间的关系。数据集的语言为英语,规模在10K到100K之间。
The ADE-Corpus-V2 dataset is a benchmark dataset for adverse drug reaction (ADE)-related sentence classification and relation extraction. It includes three configurations: Ade_corpus_v2_classification, which is used to determine whether a sentence is related to adverse drug reactions (related or unrelated); Ade_corpus_v2_drug_ade_relation, dedicated to extracting the relational pairs between drugs and adverse reactions; and Ade_corpus_v2_drug_dosage_relation, which is designed to extract the relational pairs between drugs and their dosages. The dataset is compiled in English, with a corpus size ranging from 10K to 100K instances.
提供机构:
ade-benchmark-corpus
原始信息汇总
数据集卡片 - Adverse Drug Reaction Data v2
数据集描述
数据集摘要
ADE-Corpus-V2 数据集:不良药物反应数据。该数据集用于分类句子是否与不良药物反应(ADE)相关(True)或不相关(False),以及提取不良药物事件与药物之间的关系。
DRUG-AE.rel提供药物与不良反应之间的关系。DRUG-DOSE.rel提供药物与剂量之间的关系。ADE-NEG.txt提供ADE语料库中不包含任何药物相关不良反应的所有句子。
支持的任务和排行榜
情感分类,关系提取
语言
英语
数据集结构
数据实例
配置 - Ade_corpus_v2_classification
json { "label": 1, "text": "Intravenous azithromycin-induced ototoxicity." }
配置 - Ade_corpus_v2_drug_ade_relation
json { "drug": "azithromycin", "effect": "ototoxicity", "indexes": { "drug": { "end_char": [24], "start_char": [12] }, "effect": { "end_char": [44], "start_char": [33] } }, "text": "Intravenous azithromycin-induced ototoxicity." }
配置 - Ade_corpus_v2_drug_dosage_relation
json { "dosage": "4 times per day", "drug": "insulin", "indexes": { "dosage": { "end_char": [56], "start_char": [41] }, "drug": { "end_char": [40], "start_char": [33] } }, "text": "She continued to receive regular insulin 4 times per day over the following 3 years with only occasional hives." }
数据字段
配置 - Ade_corpus_v2_classification
text- 输入文本。label- 是否与不良药物反应(ADE)相关(1)或不相关(0)。
配置 - Ade_corpus_v2_drug_ade_relation
text- 输入文本。drug- 药物名称。effect- 药物引起的效果。indexes.drug.start_char- 文本中药物字符串的起始索引。indexes.drug.end_char- 文本中药物字符串的结束索引。indexes.effect.start_char- 文本中效果字符串的起始索引。indexes.effect.end_char- 文本中效果字符串的结束索引。
配置 - Ade_corpus_v2_drug_dosage_relation
text- 输入文本。drug- 药物名称。dosage- 药物剂量。indexes.drug.start_char- 文本中药物字符串的起始索引。indexes.drug.end_char- 文本中药物字符串的结束索引。indexes.dosage.start_char- 文本中剂量字符串的起始索引。indexes.dosage.end_char- 文本中剂量字符串的结束索引。
数据分割
| 训练集 |
|---|
| 23516 |
搜集汇总
数据集介绍

背景与挑战
背景概述
ADE Corpus V2是一个专注于药物不良反应研究的英文文本数据集,包含分类和关系抽取任务,总规模约3万条数据。该数据集可用于判断句子是否包含药物不良反应信息,以及提取药物与不良反应、药物与剂量之间的关系。
以上内容由遇见数据集搜集并总结生成



