GTX.Cat
GTX.CAT是一组计算高效、性能卓越、与工业标准高度一致的生物信息二级分析软件工具集,集成了DNA序列比对、BAM预处理、BAM数据质控、变异检测等功能模块,完全遵循行业接受度最高的BWA-GATK最佳实践流程,提供了一套基因组数据分析全流程的完整解决方案。
Warning
试用版license 2022年7月16号到期
介绍¶
官网:http://www.gtxlab.com/product/cat
官方文档:http://doc.gtxlab.com/cat/zh/
GTX.CAT™工具集提供参考基因组索引构建,序列比对,排序,标重,突变检测等全基因组/外显子测序数据分析。GTX.CAT™的主程序为 gtx 。下表中列出了 gtx 支持的所有子命令,用途以及与之功能等价的BWA-GATK工具,详细的介绍可以在官方文档中查看。
子命令 | 典型用途 | 功能等价BWA-GATK工具 |
---|---|---|
index | 构建参考基因组索引 | BWA |
align | 序列比对、排序及标重 | BWA-MEM/BWA-MEM2 & Samtools sort & Picard MarkDuplicates |
bqsr | 碱基质量值校正 | GATK BaseRecalibrator & PrintReads |
vc | 胚系SNV/INDEL检测 | GATK HaplotypeCaller |
wgs | 胚系SNV/INDEL检测全流程 | BWA-GATK Best practice pipeline |
qc | NGS BAM数据质控 | Picard Metrics Collectors |
gi | 群体GVCFs导入GenomicsDB数据库 | GATK GenomicDBImport |
genotype_gvcfs | 群体联合分型 | GATK GenotypeGVCFs |
joint | 一步法联合分型 | GATK GenomicDBImport & GATK GenotypeGVCFs |
mutect2 | 肿瘤体细胞SNV/INDEL检测 | GATK Mutect2 |
pon | 构建正常样本panel | GATK CreateSomanticPanelOfNormals |
gps | 生成污染计算所需pileup统计表 | GATK GetPileupSummaries |
calc | 计算样本间交叉污染 | GATK CalculateContamination |
learn | 学习测序方向偏好性模型 | GATK LearnReadOrientationModel |
filter | 过滤体细胞SNV/INDEL突变 | GATK FilterMutectCalls |
使用举例¶
#BSUB -J gtxcat
#BSUB -n 36
#BSUB -R span[hosts=1]
#BSUB -o %J.out
#BSUB -e %J.err
#BSUB -q normal
module load gtxcat
thread=$LSB_DJOB_NUMPROC
# 建索引
gtx index hg38.fa
# 运行fq->vcf 全流程,输出排序去重后的bam文件和vcf文件
gtx wgs -t $thread -o ERR194146.vcf -b ERR194146.bam -R '@RG\tID:S1\tSM:S1' hg38.fa \
../ERR194146_1.fastq.gz ../ERR194146_2.fastq.gz
性能测试¶
使用数据为人30x WGS样本数据,单节点36核。
软件 | 时间(h) | 最大内存(GB) |
---|---|---|
bwa+GATK | 32 | 124 |
sentieon | 4.1 | 32 |
gtxcat | 3.1 | 103 |
本站总访问量 次