The reconstruction of 2,631 draft metagenome-assembled genomes from the global oceans
收藏DataCite Commons2020-09-01 更新2024-07-25 收录
下载链接:
https://figshare.com/articles/dataset/The_Reconstruction_of_2_631_Draft_Metagenome-Assembled_Genomes_from_the_Global_Oceans/5188273/9
下载链接
链接失效反馈官方服务:
资源简介:
Data for 2,631 draft genomes (TOBG-GENOMES.tar.gz) generated using the Tara Oceans microbial metagenomic data sets - additionally includes:SECONDARY_CONTIGS.province.tar.gz -- SECONDARY contigs by provinceTOBG-READCOUNT.tar.gz -- read count values of each sample against SECONDARY contigsTOBG-BINS.tar.gz -- genome bins <50% complete (15,557 bins with >5 contigs)PRIMARY_CONTIGS.province.tar.gz -- PRIMARY contigs by province and sampleLarger files have been split - to restore the full tar ball, use cat to combine. E.G. cat PRIMARY_CONTIGS.MEDITERRANEAN0* > PRIMARY_CONTIGS.MEDITERRANEAN.tar.gz cat And then decompressIndian Monsoon = 1 filesArabian Sea = 1 fileRed Sea = 1 fileMediterranean = 2 filesEast Africa Coastal = 2 filesChile-Peru Coastal = 2 filesNorth Pacific = 2 filesNorth Atlantic = 4 filesSouth Atlantic = 4 filesSouth Pacific = 7 files
本数据集包含2631份草图基因组(draft genomes)的相关数据(打包文件为TOBG-GENOMES.tar.gz),其构建依托塔拉海洋(Tara Oceans)微生物宏基因组数据集。额外附带的补充文件如下:
1. SECONDARY_CONTIGS.province.tar.gz:按海域分类的二级重叠群(contigs)数据压缩包
2. TOBG-READCOUNT.tar.gz:各样本针对二级重叠群的读长计数数据压缩包
3. TOBG-BINS.tar.gz:完整度低于50%的基因组分箱(genome bins)数据压缩包,共包含15557个分箱,每个分箱包含≥5条重叠群
4. PRIMARY_CONTIGS.province.tar.gz:按海域与样本分类的一级重叠群数据压缩包
部分大文件已被拆分,如需还原完整的压缩包,请使用cat命令合并拆分后的文件。示例命令为:cat PRIMARY_CONTIGS.MEDITERRANEAN0* > PRIMARY_CONTIGS.MEDITERRANEAN.tar.gz,完成合并后再执行解压操作。
各研究海域对应的拆分文件数量如下:
- 印度洋季风区:1个文件
- 阿拉伯海:1个文件
- 红海:1个文件
- 地中海:2个文件
- 东非沿海:2个文件
- 智利-秘鲁沿海:2个文件
- 北太平洋:2个文件
- 北大西洋:4个文件
- 南大西洋:4个文件
- 南太平洋:7个文件
提供机构:
figshare
创建时间:
2017-09-29



