1 2 3 4 5 6 7 8 9 10
| # gff文件一共9列,分别如下: ①seqid(序列ID):通常为染色体的ID; ②source(注释的来源):表示产生此文件的软件或方法; ③type(类型):表示区间特性类型,如gene,repeat_region,exon,CDS等; ④start(起始位点):特征区间的起始位置; ⑤end(结束位点):特征区间的终止位置; ⑥score(得分):表示注释信息可靠性; ⑦strand(正/负链):"+":正链,"-":负链; ⑧phase(步进):对于编码蛋白质的CDS,本列指定下一个密码子开始的位置。可以是0,1,2。表示到达下一个密码子要跳过的碱基个数; ⑨attribut(属性):基因ID,长度等信息;多个属性之间用";"分号分隔。
|
结果文件
1 2 3
| Escherichia_coli.gff #储存基因结构信息 Escherichia_coli_gene.fasta #预测基因组的核苷酸序列 Escherichia_coli_protein.fasta #预测基因组的蛋白质序列
|
下载方法
1 2 3 4 5 6 7 8 9 10
| # 下载软件和密钥 wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_dHlO8/gms2_linux_64.tar.gz wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_dHlO8/gm_key_64.gz # 解压软件 tar -zxvf gms2_linux_64.tar.gz gunzip -c gm_key_64.gz > ~/.gmhmmp2_key # 将软件添加到环境变量 vim ~/.bashrc PATH=$PATH:/opt/biosoft/gms2_linux_64 source ~/.bashrc
|
官网
1
| http://exon.gatech.edu/GeneMark/
|
使用 RAPT 组装和注释您的原核基因组
读取组装和注释管道工具 (RAPT) 是一种易于使用的试点服务,用于从细菌或古细菌分离物测序的公共或私人 Illumina 基因组读取的从头*组装和基因注释。RAPT 由三个主要组件组成,即基因组组装器 SKESA、分类分配工具 ANI和原核基因组注释管道 ( PGAP ),并在几个小时内生成质量与 RefSeq 相当的注释基因组(*了解有关 RAPT的更多信息)。
使用 RAPT,您将:
- 将您的读数组装成重叠群
- 为程序集分配一个学名
- 根据专家策划的数据(例如隐马尔可夫模型和保守域架构) 从头预测编码和非编码基因,包括抗微生物耐药性 (AMR) 基因和毒力因子