MetaGeneS


MetaGeneS

1
2
3
4
5
6
7
8
9
10
# gff文件一共9列,分别如下:
①seqid(序列ID):通常为染色体的ID;
②source(注释的来源):表示产生此文件的软件或方法;
③type(类型):表示区间特性类型,如gene,repeat_region,exon,CDS等;
④start(起始位点):特征区间的起始位置;
⑤end(结束位点):特征区间的终止位置;
⑥score(得分):表示注释信息可靠性;
⑦strand(正/负链):"+":正链,"-":负链;
⑧phase(步进):对于编码蛋白质的CDS,本列指定下一个密码子开始的位置。可以是0,1,2。表示到达下一个密码子要跳过的碱基个数;
⑨attribut(属性):基因ID,长度等信息;多个属性之间用";"分号分隔。
结果文件
1
2
3
Escherichia_coli.gff #储存基因结构信息
Escherichia_coli_gene.fasta #预测基因组的核苷酸序列
Escherichia_coli_protein.fasta #预测基因组的蛋白质序列
下载方法
1
2
3
4
5
6
7
8
9
10
# 下载软件和密钥
wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_dHlO8/gms2_linux_64.tar.gz
wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_dHlO8/gm_key_64.gz
# 解压软件
tar -zxvf gms2_linux_64.tar.gz
gunzip -c gm_key_64.gz > ~/.gmhmmp2_key
# 将软件添加到环境变量
vim ~/.bashrc
PATH=$PATH:/opt/biosoft/gms2_linux_64
source ~/.bashrc
官网
1
http://exon.gatech.edu/GeneMark/

image-20220927175255611

使用 RAPT 组装和注释您的原核基因组

读取组装和注释管道工具 (RAPT) 是一种易于使用的试点服务,用于从细菌或古细菌分离物测序的公共或私人 Illumina 基因组读取的从头*组装和基因注释。RAPT 由三个主要组件组成,即基因组组装器 SKESA、分类分配工具 ANI和原核基因组注释管道 ( PGAP ),并在几个小时内生成质量与 RefSeq 相当的注释基因组(*了解有关 RAPT的更多信息)。

使用 RAPT,您将:

  • 将您的读数组装成重叠群
  • 为程序集分配一个学名
  • 根据专家策划的数据(例如隐马尔可夫模型和保守域架构) 从头预测编码和非编码基因,包括抗微生物耐药性 (AMR) 基因和毒力因子

文章作者: LG
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 LG !
  目录