R실습동영상

 

Single cell 분석을 위한 package 소개

앞서 제가 올린 게시글의 대부분은 하단의 링크를 따라가시면, 소개되어있습니다. 제가 한 분석은 굉장히 일부분이기 때문에 앞서 소개드린 실습을 바탕으로 아래의 분석을 응용하면 좋을 것 같습니다. https://satijalab.org/seurat/articles/get_started_v5_new https://bioconductor.org/books/3.14/OSCA.advanced/ https://yulab-smu.top/biomedical-knowledge-mining-book/universal-api.html?q=hallmark#msigdb-analysis Public database 소개 https://singlecell.broadinstitute.org/single_cell https://tabula-sapiens-portal.ds.czbiohub.org/   https://gtexportal.org/home/   https://cells.ucsc.edu/?proj=hca    

Single cell RNA analysis _ #4 클러스터 분석하기

 # 클러스터내의 마커 유전자 찾기 cluster0_markers <- FindMarkers(seurat.integrated, ident.1 = 0, group.by = "seurat_clusters") cluster1_markers <- FindMarkers(seurat.integrated, ident.1 = 1, group.by = "seurat_clusters") cluster2_markers <- FindMarkers(seurat.integrated, ident.1 = 2, group.by = "seurat_clusters") cluster3_markers <- FindMarkers(seurat.integrated, ident.1 = 3, group.by = "seurat_clusters") cluster4_markers <- FindMarkers(seurat.integrated, ident.1 = 4, group.by = "seurat_clusters") cluster5_markers <- FindMarkers(seurat.integrated, ident.1 = 5, group.by = "seurat_clusters") cluster6_markers <- FindMarkers(seurat.integrated, ident.1 = 6, group.by = "seurat_clusters") cluster7_markers <- FindMarkers(seurat.integrated, ident.1 = 7, group.by = "seurat_clusters") cluster8_markers <- FindMarkers(seurat.integrated, ident.1 = 8, group.by = "seurat_clusters") cluster9_markers ...

Single cell RNA analysis _ #3 data integration 및 1차 분석

1. QC filtering   죽은 세포 혹은 데이터의 퀄리티가 좋지 않은 결과 값을 제외하고 하고자 진행 ht01 <- subset(ht01, subset = nFeature_RNA > 6000 & nFeature_RNA < 20000 & percent.mt < 20) ht02 <- subset(ht02, subset = nFeature_RNA > 6000 & nFeature_RNA < 20000 & percent.mt < 25) 2. 데이터의 전처리 각 데이터는 count 값으로 구성되어있고, 이  count는 normalization이 되지 않는 raw data임. 이를 보정하여, 세포 간의 비교가 용이하도록 발현량의 차이를 보정하는 작업이 필요함. ht01 <- NormalizeData(ht01) ht02 <- NormalizeData(ht02) single cell의 가장 큰 특징은  개별의 발현을 분석하여 cluster를 구분할 수 있는 것인데, 아래의 함수를 통해서 특정 feature (특징?)이 나타나는 것을 분석하는 작업으로 이해하면 됨. ht01 <- FindVariableFeatures(ht01) ht02 <- FindVariableFeatures(ht02) 3. 데이터 integration을 위한 개체 묶기 본 분석의 가장 큰 목적은 각 조건 별로 변화하는 클러스터를 분석하고 이해하는 것에 목적이 있기에 아래와 같이 묶어주는 작업을 먼저 한 이후에, 분석을 할 예정임.  seurat.list <- list(ht01, ht02) 4. 데이터 통합을 위한 anchor 찾기 ht01과 ht02를 분석하기 위해서 서로 간의 유사한 패턴이 나타나는 특징 및 이를 바탕으로 한 data integration을 진행하고자 함.  여기서 변화할 수 있는 것은 dims가 되는데 이는 차원 축소 값이라고 생각하면 됨....

Single cell RNA analysis _ #2 데이터 로드 & QC

경로 설정 실행하는 코드를 통해 생성되는 결과를 저장하기 위해 경로를 지정해주는 편이 수월함. Setwd"저장경로" 오늘의 실습 코드는 모두 동일하게 하기 위해서 모두 각각 2024_single_cell 폴더를 생성하고 따라하기. setwd("E:/2024_single_cell") 데이터로드 2024_single cell 폴더 안에는 또 다른 폴더들이 있을 텐데, 이를 불러오면서 설정하는 작업을 할 것임. 오늘 다룰 Single cell의 데이터는 각 이름표가 붙은 서로 다른 8개의 조건의 샘플이 있음. 그 각 조건 안에는 파일은 barcode.tsv/ feature.tsv/ matrix.mt x 로 되어있음. 이 파일 들은 아래의 명령어로 불러올 예정임. 8개의 조건을 한꺼번에 다루면 시간 소요가 너무 크기때문에 오늘의 실습에서는 2개의 조건만 불러와서 할 계획임. data1 <- Read10X(data.dir = "HT01/") data2 <- Read10X(data.dir = "HT02/") 객체 형태로 변환 작업   폴더안에 있는 파일은 R내에서 데이처를 다룰 수 있는 형태가 아니기때문에, Seurat 패키지에 포함된 함수를 이용하여, 다룰 수 있는 형태로 변환하는 것으로 이해하면 됨.  ht01 <- CreateSeuratObject(counts = data1$`Gene Expression`, project = "ht01", min.cells = 3, min.features = 200) ht02 <- CreateSeuratObject(counts = data2$`Gene Expression`, project = "ht02", min.cells = 3, min.features = 200) 위의 코드를 설명하면 다음과 같음. data1$Gene expression : data1안에는 gene expression barcode...

#single cell sequencing 기초 분석 - #1 R 설치 및 package 설치

1. R 설치 R과 R-studio를 설치할 것. 순서는 R 먼저 설치 완료 후 R-studio를 설치해야함. 순서는 반드시 지켜야 함. R 설치 URL: https://cran.yu.ac.kr/ R studio 설치 URL: https://posit.co/downloads/ 2. R package 설치 아래의 필요한 라이브러리를 install.packages("")의 명령어를 입력하여 설치      필요한 라이브러리   library(dplyr)   library(Seurat)   library(patchwork)   library(multtest)   library(metap)   library(ggplot2)   library(devtools)   - 설치 명령어 (multtest와 metap의 경우 Seurat안에 들어가있는 라이브러리이나 설치가 되지 않을 경우도 있기에 포함함.)   install.packages("dplyr")   install.packages("Seurat")    install.packages("patchwork")    install.packages("multtest")   install.packages("metap")    install.packages("ggplot2")    install.packages("devtools")  위의 명령어로 설치가 되지 않는 경우는 아래의 방법을 이용하여 설치가 가능함.  if (!require("BiocManager", quietly = TRUE))     install.packages("BiocManager") BiocManager::install("라이브러리이름") 혹시 설치에 계속해서 에러가 뜨는 경우는 R의 버전이 호환되지 않을 경우가 ...

#리눅스 -> Variant calling 총 정리 [#1~#12]

NGS 결과물로 획득된, 데이터의 Mutation calling 총 정리 #데이터 획득의 순서 Bcl -> fasta -> sam -> bam -> vcf -> txt --------------------------------------------------------------------------------------- bcl-> fasta [illumina 기계 자체내에서 generate fastaq  진행] fasta -> mapping [BWA] sam/bam file -> samtool 이용 vcf -> GATK 이용하여 mutation calling txt -> Annovar이용하여 annotation --------------------------------------------------------------------------------------- #설치해야하는 프로그램 (설치하기 전에 update 해야 함. sudo apt-get update) sudo apt-get y install bwa sudo apt-get install samtools sudo apt-get install aptitude sudo apt-get install python-is-python3 ----------------------------------------------------------------------------------------------------- sudo apt-get install openjdk-17-jdk sudo gedit ~/.bashrc 텍스트 편집기가 나타나면 하단의 명령어 추가 입력 #JAVA home setting export JAVA_HOME=$(dirname $(dirname $(readlink -f $(which java)))) export PATH=$PATH:$JAVA_HOME/bin 저장하기 누른 후, 텍스트 편집기 닫기 현재 켜져있는 터미널 창에 바로 적...