Classification of genes into Clusters of Orthologous Genes (COGs).
收藏DataONE2014-04-25 更新2024-06-27 收录
下载链接:
https://search.dataone.org/view/null
下载链接
链接失效反馈官方服务:
资源简介:
Classification of genes into Clusters of Orthologous Genes (COGs).
Each entry is a gene (or partial gene sequence) in one of the 96 single cells denovo assembled genomes or in a genome of a cultured strains.
The number in the beginnig of each header is the COG ID.
The fatsa headers for genes in a single cell genome has the following format:
>COG ID|MDA name|Detailed name|contig_<Number>_<Gene index on the contig>|Start bp|End bp|+/- Strand|Method|Description
The fatsa headers for genes in a complete genome of a cultured strain has the following format:
>COG ID|Short name|Detailed name|Start bp|End bp|+/- Strand|Method|
本数据集为将基因归类至直系同源基因簇(Clusters of Orthologous Genes, COGs)的分类数据集。
每条数据对应一条基因(或部分基因序列),其来源为96个单细胞从头组装基因组之一,或是一株人工培养菌株的基因组。
每条序列标题起始处的数字即为该基因所属的COG编号(COG ID)。
针对单细胞基因组中的基因,其FASTA序列标题格式如下:
>COG编号|MDA样本名称|详细名称|重叠群_<编号>_<该重叠群上的基因索引>|起始碱基位置|终止碱基位置|+/- 链|分析方法|功能描述
针对人工培养菌株完整基因组中的基因,其FASTA序列标题格式如下:
>COG编号|简称|详细名称|起始碱基位置|终止碱基位置|+/- 链|分析方法|
创建时间:
2014-04-25



