INPHARED_DATABASE
收藏DataCite Commons2021-04-13 更新2025-04-17 收录
下载链接:
https://leicester.figshare.com/articles/dataset/INPHARED_DATABASE/14242085
下载链接
链接失效反馈官方服务:
资源简介:
inphared.pl (INfrastructure for a PHAge REference Database) is a perl script which downloads and filters phage genomes from Genbank to provide the most complete phage genome database possible.Useful information, including viral taxonomy and bacterial host data, is extracted from the Genbank files and provided in a summary table. Genes are called on the genomes using Prokka and this output is used to gather metrics which are summarised in the output files, as well as useful input files for vConTACT2. The data provided is all genomes up to Jan 2021. This can be downloaded so users do not have to repeat the process of consistent gene calling on existing genomes. The folder GenomesDB contains subfolders each containing a subfolder that is named on the accession number of each phage. Within each folder are re-called genes in the following format *.ffn*.faa The complete genome *fna and genbank file without any annotation *gbf See https://github.com/RyanCook94/<br><br><br><br><br><br>
inphared.pl(INfrastructure for a PHAge REference Database,即噬菌体参考数据库基础设施)是一款Perl脚本,可从GenBank(基因库)下载并筛选噬菌体基因组,从而构建尽可能完整的噬菌体基因组数据库。该脚本可从GenBank文件中提取病毒分类学、细菌宿主信息等实用数据,并将其整理为摘要表格。研究人员可借助Prokka对所有基因组进行基因预测,基于该工具的输出结果统计多项指标,将指标汇总至输出文件中,同时生成可供vConTACT2使用的实用输入文件。本次提供的数据集涵盖截至2021年1月的全部噬菌体基因组。用户可直接下载该数据集,无需重复对现有基因组开展标准化基因预测流程。GenomesDB文件夹包含若干子文件夹,每个子文件夹均以对应噬菌体的登录号命名。每个子文件夹内包含以下文件:重新预测的基因文件(格式为*.ffn、*.faa)、完整基因组文件*.fna,以及无任何注释的GenBank格式文件*.gbf。详细信息可访问https://github.com/RyanCook94/
提供机构:
University of Leicester
创建时间:
2021-04-08
搜集汇总
数据集介绍

背景与挑战
背景概述
INPHARED_DATABASE是一个全面的噬菌体基因组数据库,包含截至2021年1月的所有噬菌体基因组数据,通过inphared.pl脚本从Genbank下载并经过过滤处理。数据集提供了病毒分类学、细菌宿主数据以及基因调用输出文件,适用于生物信息学研究和vConTACT2的输入文件准备。
以上内容由遇见数据集搜集并总结生成



