five

PhiSpy Predictions in GenBank Format

收藏
open.flinders.edu.au2023-04-11 更新2025-03-26 收录
下载链接:
https://open.flinders.edu.au/articles/dataset/PhiSpy_Predictions_in_GenBank_Format/22317059/1
下载链接
链接失效反馈
官方服务:
资源简介:
This file has GenBank format flat files for all the prophage regions we identified.  The GenBank files are essentially a slice of all the data from the genome annotation. We added a few PhiSpy-specific outputs, like hits to VOGdb proteins and the E-value of those matches.  We searched everything against PHROGs, but have yet to include those hits in the GenBank files.  Because there is one file for each prophage prediction (5,005,011 files), we separate them into a directory hierarchy and use the NCBI convention for storing files which uses the first three characters and then separates the numbers into directories, so if you have an accession. GCA_019958295.1, the GenBank files will be in the subdirectory phispy/GCA/019/958/295/

本文件包含了我方所识别的所有噬菌体区域对应的 GenBank 格式平坦文件。这些 GenBank 文件本质上是对基因组注释数据的切片。我们添加了一些 PhiSpy 特定的输出,例如对 VOGdb 蛋白质的匹配以及这些匹配的 E-value。我们对所有内容进行了与 PHROGs 的搜索,但尚未将这些匹配包含在 GenBank 文件中。由于每个噬菌体预测对应一个文件(共 5,005,011 个文件),我们将其分别存储在目录层次结构中,并采用 NCBI 的文件存储约定,即使用前三个字符进行分类,然后将数字分割到不同的目录中,因此,如果您拥有如 GCA_019958295.1 的访问号,则相应的 GenBank 文件将存储在 phispy/GCA/019/958/295 的子目录中。
提供机构:
open.flinders.edu.au
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作