five

Pan Matrix data

收藏
f1000.figshare.com2023-05-30 更新2025-01-21 收录
下载链接:
https://f1000.figshare.com/articles/dataset/Pan_Matrix_data/103707/1
下载链接
链接失效反馈
官方服务:
资源简介:
The file pan_matrix.txt is a huge table (tab-separated columns) where each row corresponds to a genome and each column to a domain sequences family. The rows are named by the BIOID-code, see map_ecoli.txt to look up the strain names. The columns are named Cluster 1, Cluster 2,...etc. The corresponding Pfam-A domain sequence is given in the file cluster_info.txt (see below). In cell (i,j) in this table you find the number of occurrences that domain sequence j has in genome number i.

pan_matrix.txt 文件是一个庞大的表格(采用制表符分隔的列),其中每一行对应一个基因组,每一列对应一个域序列家族。行由 BIOID 编码命名,详见 map_ecoli.txt 以查找菌株名称。列由聚类 1、聚类 2 等命名。相应的 Pfam-A 域序列在 cluster_info.txt 文件中给出(见下文)。在此表格的单元格 (i,j) 中,您可以找到域序列 j 在基因组 i 中出现的次数。
提供机构:
f1000research.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作