9월, 2024의 게시물 표시

R실습동영상

 

Single cell 분석을 위한 package 소개

앞서 제가 올린 게시글의 대부분은 하단의 링크를 따라가시면, 소개되어있습니다. 제가 한 분석은 굉장히 일부분이기 때문에 앞서 소개드린 실습을 바탕으로 아래의 분석을 응용하면 좋을 것 같습니다. https://satijalab.org/seurat/articles/get_started_v5_new https://bioconductor.org/books/3.14/OSCA.advanced/ https://yulab-smu.top/biomedical-knowledge-mining-book/universal-api.html?q=hallmark#msigdb-analysis Public database 소개 https://singlecell.broadinstitute.org/single_cell https://tabula-sapiens-portal.ds.czbiohub.org/   https://gtexportal.org/home/   https://cells.ucsc.edu/?proj=hca    

Single cell RNA analysis _ #4 클러스터 분석하기

 # 클러스터내의 마커 유전자 찾기 cluster0_markers <- FindMarkers(seurat.integrated, ident.1 = 0, group.by = "seurat_clusters") cluster1_markers <- FindMarkers(seurat.integrated, ident.1 = 1, group.by = "seurat_clusters") cluster2_markers <- FindMarkers(seurat.integrated, ident.1 = 2, group.by = "seurat_clusters") cluster3_markers <- FindMarkers(seurat.integrated, ident.1 = 3, group.by = "seurat_clusters") cluster4_markers <- FindMarkers(seurat.integrated, ident.1 = 4, group.by = "seurat_clusters") cluster5_markers <- FindMarkers(seurat.integrated, ident.1 = 5, group.by = "seurat_clusters") cluster6_markers <- FindMarkers(seurat.integrated, ident.1 = 6, group.by = "seurat_clusters") cluster7_markers <- FindMarkers(seurat.integrated, ident.1 = 7, group.by = "seurat_clusters") cluster8_markers <- FindMarkers(seurat.integrated, ident.1 = 8, group.by = "seurat_clusters") cluster9_markers ...

Single cell RNA analysis _ #3 data integration 및 1차 분석

1. QC filtering   죽은 세포 혹은 데이터의 퀄리티가 좋지 않은 결과 값을 제외하고 하고자 진행 ht01 <- subset(ht01, subset = nFeature_RNA > 6000 & nFeature_RNA < 20000 & percent.mt < 20) ht02 <- subset(ht02, subset = nFeature_RNA > 6000 & nFeature_RNA < 20000 & percent.mt < 25) 2. 데이터의 전처리 각 데이터는 count 값으로 구성되어있고, 이  count는 normalization이 되지 않는 raw data임. 이를 보정하여, 세포 간의 비교가 용이하도록 발현량의 차이를 보정하는 작업이 필요함. ht01 <- NormalizeData(ht01) ht02 <- NormalizeData(ht02) single cell의 가장 큰 특징은  개별의 발현을 분석하여 cluster를 구분할 수 있는 것인데, 아래의 함수를 통해서 특정 feature (특징?)이 나타나는 것을 분석하는 작업으로 이해하면 됨. ht01 <- FindVariableFeatures(ht01) ht02 <- FindVariableFeatures(ht02) 3. 데이터 integration을 위한 개체 묶기 본 분석의 가장 큰 목적은 각 조건 별로 변화하는 클러스터를 분석하고 이해하는 것에 목적이 있기에 아래와 같이 묶어주는 작업을 먼저 한 이후에, 분석을 할 예정임.  seurat.list <- list(ht01, ht02) 4. 데이터 통합을 위한 anchor 찾기 ht01과 ht02를 분석하기 위해서 서로 간의 유사한 패턴이 나타나는 특징 및 이를 바탕으로 한 data integration을 진행하고자 함.  여기서 변화할 수 있는 것은 dims가 되는데 이는 차원 축소 값이라고 생각하면 됨....

Single cell RNA analysis _ #2 데이터 로드 & QC

경로 설정 실행하는 코드를 통해 생성되는 결과를 저장하기 위해 경로를 지정해주는 편이 수월함. Setwd"저장경로" 오늘의 실습 코드는 모두 동일하게 하기 위해서 모두 각각 2024_single_cell 폴더를 생성하고 따라하기. setwd("E:/2024_single_cell") 데이터로드 2024_single cell 폴더 안에는 또 다른 폴더들이 있을 텐데, 이를 불러오면서 설정하는 작업을 할 것임. 오늘 다룰 Single cell의 데이터는 각 이름표가 붙은 서로 다른 8개의 조건의 샘플이 있음. 그 각 조건 안에는 파일은 barcode.tsv/ feature.tsv/ matrix.mt x 로 되어있음. 이 파일 들은 아래의 명령어로 불러올 예정임. 8개의 조건을 한꺼번에 다루면 시간 소요가 너무 크기때문에 오늘의 실습에서는 2개의 조건만 불러와서 할 계획임. data1 <- Read10X(data.dir = "HT01/") data2 <- Read10X(data.dir = "HT02/") 객체 형태로 변환 작업   폴더안에 있는 파일은 R내에서 데이처를 다룰 수 있는 형태가 아니기때문에, Seurat 패키지에 포함된 함수를 이용하여, 다룰 수 있는 형태로 변환하는 것으로 이해하면 됨.  ht01 <- CreateSeuratObject(counts = data1$`Gene Expression`, project = "ht01", min.cells = 3, min.features = 200) ht02 <- CreateSeuratObject(counts = data2$`Gene Expression`, project = "ht02", min.cells = 3, min.features = 200) 위의 코드를 설명하면 다음과 같음. data1$Gene expression : data1안에는 gene expression barcode...