리눅스 기초 #13 GATK Muteck -> mutation calling


#12에서 생성된 bam file를 이용하여 mutation calling을 진행함


GATK는 calling을 진행할 수 있는 여러 버전이 존재함

아래 종류 중에서 사용하고자 하는 버전에 맞게 명령어를 입력!

I -[input 경로]

o- [output 경로]



#GATK haployercalling

gatk HaplotypeCaller -R ${ref} -I ${aligned_reads}/1.bam -O ${results}/1_variants.vcf


#GATK Muteck2

- 일반 normal과 mathed sample이 있는 경우

gatk Mutect2 \

     -R reference.fa \

     -I tumor.bam \

     -I normal.bam \

     -normal normal_sample_name \

     --germline-resource af-only-gnomad.vcf.gz \

     --panel-of-normals pon.vcf.gz \

     -O somatic.vcf.gz


-tumor-only mode

  gatk Mutect2  -R ${ref} -I ${aligned_reads}/1.bam -O ${results}/1_raw_variants.vcf.gz


- FFPE sample mode

gatk Mutect2 -R ${ref} -I ${aligned_reads}/1.bam --f1r2-tar-gz fir2.tar.gz -O ${results}/1_FFPE_raw_variants.vcf


제대로 작동하면, vcf file 형성된 것을 볼 수 있음


참고
- https://gatk.broadinstitute.org/hc/en-us/articles/360037593851-Mutect2        - https://github.com/kpatel427/YouTubeTutorials/blob/main/variant_calling.sh
- https://www.youtube.com/watch?v=iHkiQvxyr5c

     

댓글

이 블로그의 인기 게시물

#single cell sequencing 기초 분석 - #1 R 설치 및 package 설치

리눅스 기초 #10 GATK calling을 사용하기 위하여, reference file indexing하는 방법

Single cell 분석을 위한 package 소개