five

bigbio/hprd50

收藏
Hugging Face2022-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/hprd50
下载链接
链接失效反馈
官方服务:
资源简介:
HPRD50数据集是一个从人类蛋白质参考数据库(HPRD)中随机选取并手工标注的生物医学论文摘要的数据集。数据集以XML格式解析,将每个摘要分割成句子,并在每个句子中标注了实体及其之间的相互作用。实体均为蛋白质,相互作用为蛋白质-蛋白质相互作用。所有实体都归一化到HPRD数据库,归一化后的术语存储在XML中每个实体的type属性中。该数据集适用于命名实体识别(NER)和关系抽取(RE)任务。
提供机构:
bigbio
原始信息汇总

数据集概述:HPRD50

基本信息

  • 语言: 英语
  • 许可证: 未知
  • 多语言性: 单语
  • 任务:
    • 关系抽取 (RELATION_EXTRACTION)
    • 命名实体识别 (NAMED_ENTITY_RECOGNITION)

数据集描述

  • 数据来源: 随机选取并手工标注的生物医学论文摘要,参考自人类蛋白质参考数据库(HPRD)
  • 数据格式: XML,每个摘要被分割成句子,句子中包含实体及其相互作用
  • 实体类型: 所有实体为蛋白质
  • 交互类型: 蛋白质-蛋白质交互
  • 实体标准化: 所有实体已标准化至HPRD数据库,标准化术语存储于源XML中每个实体的type属性

适用任务

  • 命名实体识别 (NER): 识别文本中的蛋白质实体
  • 关系抽取 (RE): 提取蛋白质间的相互作用关系
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作