bigbio/hprd50
收藏Hugging Face2022-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/hprd50
下载链接
链接失效反馈官方服务:
资源简介:
HPRD50数据集是一个从人类蛋白质参考数据库(HPRD)中随机选取并手工标注的生物医学论文摘要的数据集。数据集以XML格式解析,将每个摘要分割成句子,并在每个句子中标注了实体及其之间的相互作用。实体均为蛋白质,相互作用为蛋白质-蛋白质相互作用。所有实体都归一化到HPRD数据库,归一化后的术语存储在XML中每个实体的type属性中。该数据集适用于命名实体识别(NER)和关系抽取(RE)任务。
提供机构:
bigbio
原始信息汇总
数据集概述:HPRD50
基本信息
- 语言: 英语
- 许可证: 未知
- 多语言性: 单语
- 任务:
- 关系抽取 (RELATION_EXTRACTION)
- 命名实体识别 (NAMED_ENTITY_RECOGNITION)
数据集描述
- 数据来源: 随机选取并手工标注的生物医学论文摘要,参考自人类蛋白质参考数据库(HPRD)
- 数据格式: XML,每个摘要被分割成句子,句子中包含实体及其相互作用
- 实体类型: 所有实体为蛋白质
- 交互类型: 蛋白质-蛋白质交互
- 实体标准化: 所有实体已标准化至HPRD数据库,标准化术语存储于源XML中每个实体的type属性
适用任务
- 命名实体识别 (NER): 识别文本中的蛋白质实体
- 关系抽取 (RE): 提取蛋白质间的相互作用关系



