five

lightonai/SwissProt-EC-leaf

收藏
Hugging Face2022-05-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lightonai/SwissProt-EC-leaf
下载链接
链接失效反馈
官方服务:
资源简介:
Swissprot是一个高质量的手动注释蛋白质数据库,包含蛋白质功能属性的注释。该数据集提取了带有酶委员会(EC)标签的蛋白质,并移除了没有叶级EC标签的蛋白质。叶级EC标签被提取并索引,映射关系在`idx_mapping.json`文件中提供。

Swissprot is a high-quality manually curated protein database with annotations of protein functional properties. This dataset extracts proteins bearing Enzyme Commission (EC) labels, and excludes those without leaf-level EC labels. Leaf-level EC labels are extracted and indexed, and the corresponding mapping is provided in the `idx_mapping.json` file.
提供机构:
lightonai
原始信息汇总

数据集概述

数据集名称

Swissprot

数据集内容

  • 包含高质量的手动注释蛋白质序列。
  • 蛋白质具有酶委员会(Enzyme Commission, EC)标签,用于描述其功能属性。

数据集特点

  • 仅包含具有叶级EC标签的蛋白质,无叶级EC标签的蛋白质已被移除。
  • 叶级EC标签的映射关系存储在idx_mapping.json文件中。

示例

蛋白质Q87BZ2具有以下EC标签:

  • EC:2.-.-.- (Transferases)
  • EC:2.7.-.- (Transferring phosphorus-containing groups)
  • EC:2.7.1.- (Phosphotransferases with an alcohol group as acceptor)
  • EC:2.7.1.30 (Glycerol kinase)

数据集中仅提取叶级标签,如EC:2.7.1.30,对应于甘油激酶。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作