跳转至

FunGAP

FunGAP,fungal Genome Annotation Pipeline

https://github.com/CompSynBioLab-KoreaUniv/FunGAP

使用

$ module load Singularity/3.7.3

# 拷贝配置文件到本地,否则后面运行过程中会出现权限问题
$ singularity exec $IMAGE/FunGAP/FunGAP.sif cp -r  /opt/conda/config FunGAP_config

# 运行注释流程,这里使用官方example数据和参数
$ singularity exec -B ./FunGAP_config/:/opt/conda/config/ $IMAGE/FunGAP/FunGAP.sif \
/workspace/FunGAP/fungap.py --output_dir fungap_out   \
--trans_read_1 SRR1198667_1.fastq   --trans_read_2 SRR1198667_2.fastq \
--genome_assembly GCF_000146045.2_R64_genomic.fna    --augustus_species saccharomyces_cerevisiae_S288C  \
--sister_proteome prot_db.faa   --busco_dataset saccharomycetes_odb10 \
--num_cores 8 # 设置核心数

离线运行

fungap用到了busco,busco默认在运行过程中需要联网下载数据库。因此在离线环境中需要用到busco的离线运行模式,同时需要对fungap的代码进行一定的修改。

下载数据库

登录节点运行

# 下载到了当前目录的 busco_download 目录中,如这里用到的saccharomycetes_odb10
$ singularity exec $IMAGE/busco/5.5.0_cv1.sif busco --download saccharomycetes_odb10

修改代码

下载fungap代码到当前目录

$ git clone https://github.com/CompSynBioLab-KoreaUniv/FunGAP.git
FunGAP/check_inputs.pycheck_busco_dataset 函数的 159-168 注释掉,禁止运行busco --list-datasets 命令。

修改后的代码为:

def check_busco_dataset(busco_dataset):
    '''Check BUSCO dataset'''
    d_conf = import_config()
    busco_bin = d_conf['BUSCO_PATH']
    #proc = subprocess.Popen(
    #    [busco_bin, '--list-datasets'], stdout=subprocess.PIPE
    #)
    #output = str(proc.stdout.read().decode('utf-8'))
    #busco_dbs = re.findall(r'\S+_odb10', output)
    #if busco_dataset not in set(busco_dbs):
    #    sys.exit(
    #        '[ERROR] Invalid BUSCO DATASET: {}. Run busco --list-datasets to '
    #        'get a full list available datasets'.format(busco_dataset)
    #    )
    print('BUSCO_DATASET is ok...')
修改 FunGAP/run_busco.py 第121行,添加 --offline 选项,让busco离线运行。

修改后的代码为:

        command = (
            '{} --mode proteins --out {} --in {} --out_path {} '
            '--lineage_dataset {} --offline --force > {} 2>&1'.format(
                busco_bin, input_base, input_fasta, output_dir, lineage_dataset,
                log_file
            )

运行

# 拷贝配置文件到本地,否则后面运行过程中会出现权限问题
$ singularity exec $IMAGE/FunGAP/FunGAP.sif cp -r  /opt/conda/config FunGAP_config

# 拷贝fungap.conf文件
$ singularity exec $IMAGE/FunGAP/FunGAP.sif cp /workspace/FunGAP/fungap.conf FunGAP/

# 运行注释流程,这里使用官方example数据和参数
$ singularity exec -B ./FunGAP_config/:/opt/conda/config/ $IMAGE/FunGAP/FunGAP.sif \
./FunGAP/fungap.py --output_dir fungap_out   \
--trans_read_1 SRR1198667_1.fastq   --trans_read_2 SRR1198667_2.fastq \
--genome_assembly GCF_000146045.2_R64_genomic.fna    --augustus_species saccharomyces_cerevisiae_S288C  \
--sister_proteome prot_db.faa   --busco_dataset saccharomycetes_odb10 \
--num_cores 8 # 设置核心数
本文阅读量  次
本站总访问量  次