Diamond生信比对教程


Diamond教程

1.下载安装包

wget http://github.com/bbuchfink/diamond/releases/download/v0.9.25/diamond-linux64.tar.gz

2.解压

进入到下载目录解压文件

tar -zxvf diamond-linux64.tar.gz

3.部署bin根目录启动

sudo mv diamond /usr/local/bin


如上软件安装完成!


4.配置数据库

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 下载nr库
nohup wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz 2>&1 &
# 解压nr压缩包
gunzip nr.gz
# 建库
diamond makedb --in nr --db nr
# -------------------------------------------------------------------
####NCBI-nr数据库下载
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz
####env_nr(来自环境的nr)数据库下载
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/env_nr.gz
####swissprot,高质量的蛋白数据库下载,蛋白序列得到实验的验证
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/swissprot.gz
###通用蛋白质资源(UniProt90)
wget ftp://ftp.expasy.org/databases/uniprot/current_release/uniref/uniref90/uniref90.fasta.gz

5.比对

1
2
3
4
# blastp 蛋白比对
diamond blastp --db nr -q input.faa -o protein_matches_fmt6.txt
# blastx DNA比对
diamond blastx --db nr -q input.fna -o dna_matches_fmt6.txt

注:默认以–outfmt 6输出结果和BLAST+的–outfmt 6结果一致

6.结果解读

Diamond默认设置下输出表格格式的结果。

结果12列,其结果信息和BLAST默认设置-outfmt 6输出的格式完全一致。

1
2
3
4
5
6
7
8
9
10
11
12
1. query序列ID
2. subject序列ID
3. Identity百分比
4. 匹配长度
5. 错配长度
6. 打开Gap的次数
7. query序列起始位点
8. query序列结束位点
9. subject序列起始位点
10. subject序列结束位点
11. E-vaule值
12. bitscore得分

文章作者: Grail Lee
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Grail Lee !
  目录