跳转至

maker

介绍

maker是一个比较强大的基因组注释pipeline软件,其可以整合多种数据库、软件对基因组进行注释。

maker使用MPI库编写软件,能最大限度利用集群所有计算资源,极大地缩减了基因组注释所需的时间。

使用maker,测试了水稻MH63的11号染色体(MH63 Chr11),32MB左右,申请资源20*6核心,大约4小时就可以跑完。

https://github.com/Yandell-Lab/maker

软件运行

载入maker,如果没有特殊需求,建议载入最新的版本。

module load maker/3.01.03

如果是第一次使用,需要先运行maker -CTL生成配置文件,然后在maker_opts.ctl中添加对应的genome、protein、est文件等。

LSF并行环境下运行,申请100核(-n 100),每个节点20核(-R "span[ptile=20]"),同时使用5个节点(100/20),这种模式必须使用parallel队列(需要向管理员申请开通队列使用权限)。

#BSUB -J maker        
#BSUB -q parallel     
#BSUB -n 100              
#BSUB -R "span[ptile=20]"       
#BSUB -o stdout_%J.out    
#BSUB -e stderr_%J.err     
module purge
module load maker/3.01.03
mpirun -np $LSB_DJOB_NUMPROC maker -base round1 maker_bopts.ctl maker_exe.ctl maker_opts.ctl 2>&1

注意事项

资源申请

maker运行时一次申请核数过多会导致排队时间较长,对于一般基因组,建议申请100核即可。

资源非常紧张时,建议将染色体拆分,每个染色体跑一个maker作业,每个作业申请几十核,最后再合并结果。parallel队列每人只能使用120核。

使用自训练augustus模型

augustus

错误处理

maker运行过程中会出现FAILED的情况,如下所示。这种情况作业不会停下,但软件处于空跑状态,没有结果更新。

因此在跑maker的过程中需要及时关注prefix_round1_master_datastore_index.log运行日志的输出,以免因程序运行出错导致浪费太多资源和时间。

出现FAILED的情况时,对于小基因组,建议杀掉作业直接重跑,或者调整参数再重跑;对于大基因组,建议将出错的染色体单独重跑,然后再合并结果。

$ cat round1.maker.output/round1_master_datastore_index.log 
Chr01   round1_datastore/D0/AB/Chr01/   STARTED
Chr02   round1_datastore/D6/BF/Chr02/   STARTED
Chr03   round1_datastore/FC/43/Chr03/   STARTED
Chr04   round1_datastore/AB/6D/Chr04/   STARTED
Chr05   round1_datastore/2A/B2/Chr05/   STARTED
Chr06   round1_datastore/94/77/Chr06/   STARTED
Chr07   round1_datastore/20/25/Chr07/   STARTED
Chr08   round1_datastore/45/CE/Chr08/   STARTED
Chr09   round1_datastore/F1/4B/Chr09/   STARTED
Chr10   round1_datastore/7C/72/Chr10/   STARTED
Chr11   round1_datastore/1E/AA/Chr11/   STARTED
Chr12   round1_datastore/1B/FA/Chr12/   STARTED
Chr12   round1_datastore/1B/FA/Chr12/   FAILED
Chr09   round1_datastore/F1/4B/Chr09/   FAILED
Chr03   round1_datastore/FC/43/Chr03/   FINISHED
Chr10   round1_datastore/7C/72/Chr10/   FINISHED
Chr04   round1_datastore/AB/6D/Chr04/   FINISHED
Chr05   round1_datastore/2A/B2/Chr05/   FINISHED
Chr07   round1_datastore/20/25/Chr07/   FINISHED
Chr02   round1_datastore/D6/BF/Chr02/   FINISHED
Chr08   round1_datastore/45/CE/Chr08/   FINISHED
Chr11   round1_datastore/1E/AA/Chr11/   FINISHED
Chr01   round1_datastore/D0/AB/Chr01/   FAILED
Chr06   round1_datastore/94/77/Chr06/   FINISHED 

参考

MAKER Tutorial for WGS Assembly and Annotation Winter School 2018

Genome Annotation using MAKER

基因注释:基于SNAP+Augustus+GeneMark的maker3 pipeline

Using MAKER for Genome Annotation

Genome Annotation and Curation Using MAKER and MAKER-P

本文阅读量  次
本站总访问量  次