细菌基因组组装


基因组组装

目前推荐两种主流的基因组组装方式:

附:MD5校验数据完整性

1
md5sum -c <*md5.txt>

Spades(一)

简介:主流的组装方式中对于单基因组装,二代测序用Spades组装成草图的效果最好,辅以unicycler外加三代测序进行矫正可以得到质量很高的完成图。

软件下载

github:https://github.com/ablab/spades

1
2
3
4
5
6
7
8
9
10
11
12
# 解压
wget http://cab.spbu.ru/files/release3.15.5/SPAdes-3.15.5-Linux.tar.gz
tar -zxvf SPAdes-xxx-Linux.tar.gz
cd SPAdes-xxx-Linux/bin
ls
# 测试
./spades.py --test
# 常规使用
./spades.py --pe1-1 gene_1.fq.gz --pe1-2 gene_2.fq.gz -t 8 -k 15,21,33,55,77,99,127 --cov-cutoff auto --careful -o output
# 推荐终端后台挂机使用
nohup ./spades.py --pe1-1 gene_1.fq.gz --pe1-2 gene_2.fq.gz -t 8 -k 15,21,33,55,77,99,127 --cov-cutoff auto --careful -o output >output.file 2>&1 &
# 结果集存于output,运行状态文件输出至output.file

Megahit(二)

简介:megahit常用于宏基因组数据组装,其处理速度极佳,组装质量尚可,在无过高质量要求且项目进度紧迫时的最佳选择。megahit是SOAPdenovo2的官方升级版,各方面性能均优于前者,因此较为推荐。

软件下载:

github:https://github.com/voutcn/megahit

1
2
3
4
5
6
7
8
9
# conda安装
conda install -c bioconda megahit
# 直接下载二进制文件
wget https://github.com/voutcn/megahit/releases/download/v1.2.9/MEGAHIT-1.2.9-Linux-x86_64-static.tar.gz
# 解压
tar -zvxf MEGAHIT-1.2.9-Linux-x86_64-static.tar.gz
cd MEGAHIT-1.2.9-Linux-x86_64-static/bin/ #可以看到目录下的可执行文件megahit
# 执行
./megahit -1 gene_1.fq.gz -2 gene_2.fq.gz -o assemble

文章作者: Grail Lee
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Grail Lee !
  目录