DanielHesslow/SwissProt-GO
收藏Hugging Face2022-04-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DanielHesslow/SwissProt-GO
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- protein sequences
datasets:
- Swissprot
tags:
- Protein
- Gene Ontology
- GO
---
Swissprot is a high quality manually annotated protein database. The dataset contains annotations with the functional properties of the proteins. Here we extract proteins with Gene Ontology labels.
The dataset is ported from Protinfer: https://github.com/google-research/proteinfer.
The GO-labels are extracted and indexed, the mapping is provided in `idx_mapping.json`. Proteins without GO tags are removed.
提供机构:
DanielHesslow
原始信息汇总
数据集概述
数据集名称
- Swissprot
数据集内容
- 包含高质量手动注释的蛋白质序列数据。
- 数据集中的蛋白质具有基因本体(Gene Ontology, GO)标签。
数据集特点
- 专注于蛋白质的功能属性。
- 仅包含带有GO标签的蛋白质,无GO标签的蛋白质已被移除。
数据集来源
- 从Protinfer项目中提取,该项目位于https://github.com/google-research/proteinfer。
数据集文件
idx_mapping.json:提供GO标签的映射信息。



