Single cell RNA analysis _ #2 데이터 로드 & QC
경로 설정
실행하는 코드를 통해 생성되는 결과를 저장하기 위해 경로를 지정해주는 편이 수월함.
Setwd"저장경로"
오늘의 실습 코드는 모두 동일하게 하기 위해서 모두 각각 2024_single_cell 폴더를 생성하고 따라하기.
setwd("E:/2024_single_cell")데이터로드
2024_single cell 폴더 안에는 또 다른 폴더들이 있을 텐데, 이를 불러오면서 설정하는 작업을 할 것임.
오늘 다룰 Single cell의 데이터는 각 이름표가 붙은 서로 다른 8개의 조건의 샘플이 있음.
그 각 조건 안에는 파일은 barcode.tsv/ feature.tsv/ matrix.mtx 로 되어있음.
이 파일 들은 아래의 명령어로 불러올 예정임. 8개의 조건을 한꺼번에 다루면 시간 소요가 너무 크기때문에 오늘의 실습에서는 2개의 조건만 불러와서 할 계획임.
data1 <- Read10X(data.dir = "HT01/")
data2 <- Read10X(data.dir = "HT02/")객체 형태로 변환 작업
폴더안에 있는 파일은 R내에서 데이처를 다룰 수 있는 형태가 아니기때문에, Seurat 패키지에 포함된 함수를 이용하여, 다룰 수 있는 형태로 변환하는 것으로 이해하면 됨.ht01 <- CreateSeuratObject(counts = data1$`Gene Expression`, project = "ht01", min.cells = 3, min.features = 200)
ht02 <- CreateSeuratObject(counts = data2$`Gene Expression`, project = "ht02", min.cells = 3, min.features = 200)
위의 코드를 설명하면 다음과 같음.
data1$Gene expression : data1안에는 gene expression barcode와 CSP에 대한 정보가 같이 있는 상태임.
하지만 이미 우리의 데이터틑 demultiplxeing 그러니까 CSP를 더이상 구분할 필요가 없기 때문에 Gene Expression data 만 불러오면 됨.
project = "ht01" : 본 데이터를 이용하여, 가공을 진행할 예정인데 이 가공을 진행하는 데이터의 이름을 명명해주는 작업임.
min.cell = 최소 x개의 세포에서 발현하는 유전자
min.features = 최소 x개의 세포에서 발현하는 transcript
min.cell와 min.features는 조건에 따라 변환시킬 수 있으나, 오늘은 default 값으로 진행함.데이터 QC 체크
미토콘드리아 DNA가 존재하는 유전자의 비율을 계산. 일반적으로 미토콘드리아 유전자는 MT로 시작하는 특성이 있기 때문에 아래의 코드는 MT로 시작하는 유전자의 비율을 계산해달라는 의미로 이해하면 됨.
ht01[["percent.mt"]] <- PercentageFeatureSet(ht01, pattern = "^MT-")
ht02[["percent.mt"]] <- PercentageFeatureSet(ht02, pattern = "^MT-")데이터 QC 그림화
VlnPlot(ht01, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)
ncol 이라는 의미는 한 줄에 표시되는 그림의 갯수가 몇 개인지를 지정해주는 것임.
[코드 한 번에 재 작성 - 하단]setwd("E:/2024_single_cell")
data1 <- Read10X(data.dir = "HT01/")
data2 <- Read10X(data.dir = "HT02/")ht01 <- CreateSeuratObject(counts = data1$`Gene Expression`, project = "ht01", min.cells = 3, min.features = 200)
ht02 <- CreateSeuratObject(counts = data2$`Gene Expression`, project = "ht02", min.cells = 3, min.features = 200)ht01[["percent.mt"]] <- PercentageFeatureSet(ht01, pattern = "^MT-")
ht02[["percent.mt"]] <- PercentageFeatureSet(ht02, pattern = "^MT-")
VlnPlot(ht01, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)
파일을 바로 저장하는 방법은 아래와 같은 코드pdf("VlnPlot_HT01.pdf", width = 12, height = 6) # 파일 이름과 크기를 설정
VlnPlot(ht01, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)
dev.off()
댓글
댓글 쓰기