five

DanielHesslow/SwissProt-GO

收藏
Hugging Face2022-04-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DanielHesslow/SwissProt-GO
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - protein sequences datasets: - Swissprot tags: - Protein - Gene Ontology - GO --- Swissprot is a high quality manually annotated protein database. The dataset contains annotations with the functional properties of the proteins. Here we extract proteins with Gene Ontology labels. The dataset is ported from Protinfer: https://github.com/google-research/proteinfer. The GO-labels are extracted and indexed, the mapping is provided in `idx_mapping.json`. Proteins without GO tags are removed.
提供机构:
DanielHesslow
原始信息汇总

数据集概述

数据集名称

  • Swissprot

数据集内容

  • 包含高质量手动注释的蛋白质序列数据。
  • 数据集中的蛋白质具有基因本体(Gene Ontology, GO)标签。

数据集特点

  • 专注于蛋白质的功能属性。
  • 仅包含带有GO标签的蛋白质,无GO标签的蛋白质已被移除。

数据集来源

数据集文件

  • idx_mapping.json:提供GO标签的映射信息。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作