面向“基因-疾病”关联机理的科学文献挖掘任务(AGAC)数据集
收藏阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/148291
下载链接
链接失效反馈官方服务:
资源简介:
在海量科学文献中,“基因-疾病”的关联机理通过突变、基因等系列分子对象及其触发词获得描述,自然语言处理为自动挖掘这一隐性知识条目提供了可能,亦为健康医学信息的自动化处理提供解决方案。<br />
本任务来自CHIP2022学术评测[任务一](http://cips-chip.org.cn/2022/eval1),研究人员可以访问官网申请数据:http://lit-evi.hzau.edu.cn/AGAC-CHIP2022/
Within massive scientific literature, the mechanisms of gene-disease associations are described through a series of molecular entities such as mutations and genes along with their trigger words. Natural Language Processing (NLP) enables the automatic extraction of these implicit knowledge entries, and also provides solutions for the automated processing of health and medical information.
This task originates from Task 1 of the CHIP2022 academic evaluation (http://cips-chip.org.cn/2022/eval1). Researchers can apply for access to the dataset via its official website: http://lit-evi.hzau.edu.cn/AGAC-CHIP2022/
提供机构:
阿里云天池
创建时间:
2023-03-16
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集源自CHIP2022学术评测任务一,专注于利用自然语言处理技术从科学文献中挖掘基因与疾病之间的关联机理。它包含触发词实体识别、语义角色识别和知识发现三个子任务,数据格式为JSON和TSV,基于PubMed文献构建,由华中农业大学信息学院提供。
以上内容由遇见数据集搜集并总结生成



