基因组组装
目前推荐两种主流的基因组组装方式:
附:MD5校验数据完整性
Spades(一)
简介:主流的组装方式中对于单基因组装,二代测序用Spades组装成草图的效果最好,辅以unicycler外加三代测序进行矫正可以得到质量很高的完成图。
软件下载
github:https://github.com/ablab/spades
1 2 3 4 5 6 7 8 9 10 11 12
| wget http://cab.spbu.ru/files/release3.15.5/SPAdes-3.15.5-Linux.tar.gz tar -zxvf SPAdes-xxx-Linux.tar.gz cd SPAdes-xxx-Linux/bin ls
./spades.py --test
./spades.py --pe1-1 gene_1.fq.gz --pe1-2 gene_2.fq.gz -t 8 -k 15,21,33,55,77,99,127 --cov-cutoff auto --careful -o output
nohup ./spades.py --pe1-1 gene_1.fq.gz --pe1-2 gene_2.fq.gz -t 8 -k 15,21,33,55,77,99,127 --cov-cutoff auto --careful -o output >output.file 2>&1 &
|
Megahit(二)
简介:megahit常用于宏基因组数据组装,其处理速度极佳,组装质量尚可,在无过高质量要求且项目进度紧迫时的最佳选择。megahit是SOAPdenovo2的官方升级版,各方面性能均优于前者,因此较为推荐。
软件下载:
github:https://github.com/voutcn/megahit
1 2 3 4 5 6 7 8 9
| conda install -c bioconda megahit
wget https://github.com/voutcn/megahit/releases/download/v1.2.9/MEGAHIT-1.2.9-Linux-x86_64-static.tar.gz
tar -zvxf MEGAHIT-1.2.9-Linux-x86_64-static.tar.gz cd MEGAHIT-1.2.9-Linux-x86_64-static/bin/
./megahit -1 gene_1.fq.gz -2 gene_2.fq.gz -o assemble
|