five

INPHARED_DATABASE

收藏
figshare.le.ac.uk2021-04-13 更新2025-03-25 收录
下载链接:
https://figshare.le.ac.uk/articles/dataset/INPHARED_DATABASE/14242085/1
下载链接
链接失效反馈
官方服务:
资源简介:
inphared.pl (INfrastructure for a PHAge REference Database) is a perl script which downloads and filters phage genomes from Genbank to provide the most complete phage genome database possible.Useful information, including viral taxonomy and bacterial host data, is extracted from the Genbank files and provided in a summary table. Genes are called on the genomes using Prokka and this output is used to gather metrics which are summarised in the output files, as well as useful input files for vConTACT2. The data provided is all genomes up to Jan 2021. This can be downloaded so users do not have to repeat the process of consistent gene calling on existing genomes. The folder GenomesDB contains subfolders each containing a subfolder that is named on the accession number of each phage. Within each folder are re-called genes in the following format *.ffn*.faa The complete genome *fna and genbank file without any annotation *gbf See https://github.com/RyanCook94/

inphared.pl(INfrastructure for a PHAge REference Database)是一款Perl脚本,该脚本从Genbank下载并筛选噬菌体基因组,以提供尽可能完整的噬菌体基因组数据库。从Genbank文件中提取的有用信息,包括病毒分类学和细菌宿主数据,以汇总表格的形式提供。通过Prokka对基因组进行基因注释,并利用此输出收集度量指标,这些指标总结在输出文件中,同时为vConTACT2提供有用的输入文件。所提供的数据包括截至2021年1月的所有基因组。用户可以下载这些数据,无需重复对现有基因组进行一致的基因注释过程。GenomesDB文件夹包含子文件夹,每个子文件夹都包含以每个噬菌体的接入号命名的子文件夹。在每个文件夹中,都包含以下格式的重新注释基因:*.ffn*.faa,以及完整的基因组文件*fna和未经任何注释的genbank文件*gbf。更多信息请见https://github.com/RyanCook94/
提供机构:
figshare.le.ac.uk
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作