cnachteg/duvel
收藏Hugging Face2024-05-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cnachteg/duvel
下载链接
链接失效反馈官方服务:
资源简介:
该数据集旨在识别科学文献中的寡基因变异组合,特别是涉及两个基因及其突变的组合,这些组合可能导致遗传疾病。数据集目前仅包含双基因变异组合,即涉及两个基因和至少两个变异的组合。数据集用于二元关系抽取任务,其中实体在文本中被掩码。数据集包含文本分类任务,用于训练模型识别文本中是否存在有效的双基因变异组合。数据集由专家生成,语言为英语,包含训练、验证和测试三个分割。数据集的创建过程包括从OLIDA数据库中检索科学文献,使用PubTator API进行预注释,并通过ALAMBIC平台进行注释。数据集的使用有助于复杂遗传疾病的整理和研究。
提供机构:
cnachteg
原始信息汇总
数据集概述
数据集目的
该数据集旨在识别科学英文文章中的寡基因变异组合,即多个基因及其突变与遗传疾病之间的关系。
数据集内容
目前,数据集仅包含二基因变异组合,即两个基因与至少两个变异之间的关系。
数据集应用
数据集用于二元关系抽取,其中实体在文本中被掩码处理。



