five

Daucus_glochidiatus_285038

收藏
DataONE2017-03-10 更新2024-06-26 收录
下载链接:
https://search.dataone.org/view/null
下载链接
链接失效反馈
官方服务:
资源简介:
Bam file containing all reads that mapped to individual plastid reference. This reference contains only 1 inverted repeat. Commands used to create bam file is as follows: bwa mem -a -M -t 8 -R "@RG\tID:Accession\tLB:barcode\tPL:illumina\tSM:accession_number\tPI:350" reference.fa fastq1 fastq2 | awk '$3 != "*"' >name.sam samtools view -bt reference.fa.fai -o name.bam name.sam samtools sort name.bam name.s samtools view -b -q 30 -f 2 name.s.bam >name.sq.bam samtools index name.sq.bam java -Xmx4g -jar /usr/local/bin/picard-tools/picard.jar MarkDuplicates I=name.sq.bam M=metrics.name.txt TMP_DIR=/tmp MAX_FILE_HANDLES_FOR_READ_ENDS_MAP=900 O=Final.bam bwa version 0.7.15-r1140 samtools version 0.1.19-44428cd java version 1.8.0_111 picard version 2.7.1

本BAM文件(Binary Alignment Map)包含所有比对至单份质体参考序列的测序读段(reads)。该参考序列仅包含1个反向重复序列(inverted repeat)。 生成该BAM文件所用的命令及流程说明如下: 1. 使用bwa mem工具进行序列比对,参数依次为:-a(输出所有比对结果)、-M(将较短的比对分割为次级比对)、-t 8(启用8个计算线程)、-R 追加读段组注释:@RG ID:Accession LB:barcode PL:illumina SM:accession_number PI:350,参考序列文件为reference.fa,输入测序数据为fastq1和fastq2;将比对结果通过awk过滤,剔除未比对的读段(即参考序列字段为*的行),并将结果输出至name.sam文件: bwa mem -a -M -t 8 -R "@RG ID:Accession LB:barcode PL:illumina SM:accession_number PI:350" reference.fa fastq1 fastq2 | awk '$3 != "*"' >name.sam 2. 使用samtools view工具,基于参考序列索引文件reference.fa.fai,将name.sam转换为BAM格式并输出为name.bam: samtools view -bt reference.fa.fai -o name.bam name.sam 3. 使用samtools sort工具对name.bam进行排序,输出为name.s.bam: samtools sort name.bam name.s 4. 使用samtools view工具提取比对质量值≥30且为正确配对的读段,输出为name.sq.bam: samtools view -b -q 30 -f 2 name.s.bam >name.sq.bam 5. 使用samtools index工具为name.sq.bam构建索引文件: samtools index name.sq.bam 6. 通过Java调用Picard工具的MarkDuplicates模块,分配最大4GB内存,去除PCR重复,输入文件为name.sq.bam,去重统计指标输出至metrics.name.txt,临时目录设置为/tmp,最大文件句柄数设为900,最终输出去重后的BAM文件Final.bam: java -Xmx4g -jar /usr/local/bin/picard-tools/picard.jar MarkDuplicates I=name.sq.bam M=metrics.name.txt TMP_DIR=/tmp MAX_FILE_HANDLES_FOR_READ_ENDS_MAP=900 O=Final.bam 所用工具版本信息如下: bwa版本:0.7.15-r1140 samtools版本:0.1.19-44428cd Java版本:1.8.0_111 Picard版本:2.7.1
创建时间:
2017-03-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作