five

GapMind 2024

收藏
DataCite Commons2024-10-14 更新2024-11-06 收录
下载链接:
https://figshare.com/articles/dataset/GapMind_2024/27229272
下载链接
链接失效反馈
官方服务:
资源简介:
GapMind is an automated web-based tool for annotating amino acid biosynthesis pathways in bacterial and archaeal genomes. We updated GapMind to include recently identified enzymes, including new enzymes that we identified by using high-throughput genetics and comparative genomics.GapMind_Oct2024.tar.gz -- tarball of source code and compiled rules for the GapMind for amino acid biosynthesis. The compiled rules are in tmp/path.aa/orgsDef_206_ngaps.tsv -- table of prototrophic bacteria and archaea and the number of gaps in each genome (considering only steps on the best path that lacked even a medium-confidence step in either the protein annotation or the 6-frame translation)known_auxo.tsv -- table of known auxotrophies for bacteriaorgsDef_206.tar.gz -- GapMind analysis of the 206 prototroph genomes (tmp/orgsDef) and for the 6-frame translation (tmp/orgsDef.6f)orgsAuxo_28.tar.gz -- GapMind analysis of the 28 auxotroph genomesngaps.image -- R image including the ngaps table, the gaps table (one row per genome x pathway), and the best table (one row for each step on the best path for each genome x pathway)aa3.R -- R code for generating the tables in the R image

GapMind是一款基于网页的自动化工具,可用于注释细菌与古菌基因组中的氨基酸生物合成通路。我们对GapMind进行了更新,纳入了近期发现的酶类,其中包括我们通过高通量遗传学与比较基因组学手段鉴定得到的新型酶。 GapMind_Oct2024.tar.gz:用于氨基酸生物合成分析的GapMind源代码与编译规则tar打包文件。其编译规则存储于tmp/path.aa/orgsDef_206_ngaps.tsv——该文件为原养型细菌与古菌的统计表,同时记录了每个基因组中的通路缺口数量,统计范围仅涵盖最佳通路中,在蛋白质注释或6框翻译(6-frame translation)中均缺乏中等置信度对应步骤的环节。 known_auxo.tsv:细菌已知营养缺陷型统计表。 orgsDef_206.tar.gz:针对206个原养型基因组(对应路径tmp/orgsDef)及其6框翻译版本(对应路径tmp/orgsDef.6f)开展的GapMind分析结果打包文件。 orgsAuxo_28.tar.gz:针对28个营养缺陷型基因组开展的GapMind分析结果打包文件。 ngaps.image:包含缺口数量统计表、缺口统计表(每行对应一组基因组-通路组合)以及最佳路径统计表(每行对应一组基因组-通路组合的最佳通路中的某一步骤)的R语言镜像文件。 aa3.R:用于生成上述R镜像文件中各统计表的R代码脚本。
提供机构:
figshare
创建时间:
2024-10-14
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
GapMind 2024是一个用于注释细菌和古菌基因组中氨基酸生物合成途径的工具数据集,包含源代码、编译规则和多个基因组分析结果文件。数据集更新了最新发现的酶信息,适用于序列分析领域的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作