GTX.Cat
GTX.CAT是一组计算高效、性能卓越、与工业标准高度一致的生物信息二级分析软件工具集,集成了DNA序列比对、BAM预处理、BAM数据质控、变异检测等功能模块,完全遵循行业接受度最高的BWA-GATK最佳实践流程,提供了一套基因组数据分析全流程的完整解决方案。
Warning
试用版license 2022年7月16号到期
介绍¶
官网:http://www.gtxlab.com/product/cat
官方文档:http://doc.gtxlab.com/cat/zh/
GTX.CAT™工具集提供参考基因组索引构建,序列比对,排序,标重,突变检测等全基因组/外显子测序数据分析。GTX.CAT™的主程序为 gtx 。下表中列出了 gtx 支持的所有子命令,用途以及与之功能等价的BWA-GATK工具,详细的介绍可以在官方文档中查看。
| 子命令 | 典型用途 | 功能等价BWA-GATK工具 |
|---|---|---|
| index | 构建参考基因组索引 | BWA |
| align | 序列比对、排序及标重 | BWA-MEM/BWA-MEM2 & Samtools sort & Picard MarkDuplicates |
| bqsr | 碱基质量值校正 | GATK BaseRecalibrator & PrintReads |
| vc | 胚系SNV/INDEL检测 | GATK HaplotypeCaller |
| wgs | 胚系SNV/INDEL检测全流程 | BWA-GATK Best practice pipeline |
| qc | NGS BAM数据质控 | Picard Metrics Collectors |
| gi | 群体GVCFs导入GenomicsDB数据库 | GATK GenomicDBImport |
| genotype_gvcfs | 群体联合分型 | GATK GenotypeGVCFs |
| joint | 一步法联合分型 | GATK GenomicDBImport & GATK GenotypeGVCFs |
| mutect2 | 肿瘤体细胞SNV/INDEL检测 | GATK Mutect2 |
| pon | 构建正常样本panel | GATK CreateSomanticPanelOfNormals |
| gps | 生成污染计算所需pileup统计表 | GATK GetPileupSummaries |
| calc | 计算样本间交叉污染 | GATK CalculateContamination |
| learn | 学习测序方向偏好性模型 | GATK LearnReadOrientationModel |
| filter | 过滤体细胞SNV/INDEL突变 | GATK FilterMutectCalls |
使用举例¶
#BSUB -J gtxcat
#BSUB -n 36
#BSUB -R span[hosts=1]
#BSUB -o %J.out
#BSUB -e %J.err
#BSUB -q normal
module load gtxcat
thread=$LSB_DJOB_NUMPROC
# 建索引
gtx index hg38.fa
# 运行fq->vcf 全流程,输出排序去重后的bam文件和vcf文件
gtx wgs -t $thread -o ERR194146.vcf -b ERR194146.bam -R '@RG\tID:S1\tSM:S1' hg38.fa \
../ERR194146_1.fastq.gz ../ERR194146_2.fastq.gz
性能测试¶
使用数据为人30x WGS样本数据,单节点36核。
| 软件 | 时间(h) | 最大内存(GB) |
|---|---|---|
| bwa+GATK | 32 | 124 |
| sentieon | 4.1 | 32 |
| gtxcat | 3.1 | 103 |
本站总访问量 次