DFKI-SLT/tbga
收藏Hugging Face2024-08-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/DFKI-SLT/tbga
下载链接
链接失效反馈官方服务:
资源简介:
TBGA是一个用于基因-疾病关联(GDA)提取的大规模数据集,包含超过200,000个实例和100,000个独特的基因-疾病对。数据集是从超过700,000篇出版物中生成的,每个实例包括提取GDA的具体句子、提取的GDA本身以及涉及的基因-疾病对的详细信息。数据集采用半自动标注方法,数据来源于DisGeNET数据库,遵循OpenNRE格式,包含四种关系类型。数据集的语言为英语,分为训练集、验证集和测试集。
TBGA是一个用于基因-疾病关联(GDA)提取的大规模数据集,包含超过200,000个实例和100,000个独特的基因-疾病对。数据集是从超过700,000篇出版物中生成的,每个实例包括提取GDA的具体句子、提取的GDA本身以及涉及的基因-疾病对的详细信息。数据集采用半自动标注方法,数据来源于DisGeNET数据库,遵循OpenNRE格式,包含四种关系类型。数据集的语言为英语,分为训练集、验证集和测试集。
提供机构:
DFKI-SLT



