Principal component analysis (PCA) 分析
主成分分析(PCA)幫助咱們概括總結和可視化數據集中的信息,這些數據包含由多個相互關聯的變量描述的個體 / 觀察主成分分析。 能夠將每一個變量視爲不一樣的維度。 但若是您的數據集中有3個以上的變量,那麼很難在多維超空間可視化。 主成分分析是用來從一個多變量數據表中提取重要信息,並將這些信息表示爲一組稱爲主成分的新變量。 這些新的變量至關於原始數據的線性組合。 主成分的個數小於或等於原始變量的個數。 給定數據集中的信息對應於它所包含的總變差。 主成分分析的目的是肯定數據變化最大的方向(或主成分)。換句話說,主成分分析將多變量數據的維數下降爲兩個或三個主成分,這些主成分能夠以圖形化的方式顯示,信息損失最小。轉錄組中,通常用來檢驗不一樣處理組樣本間重複性的好壞。更多PCA原理及分析方法請點擊文末的PCA分析資料,下面小編用本身的數據在R中進行PCA分析。ide
PCA可視化
- 數據展現
- 代碼展現
****************************************************************************************************** #### RNA-seq樣本PCA分析#### #加載的R包 install.packages(c("ggpubr","ggthemes","gmodels")) library(ggpubr) #加載差別基因表達矩陣 library(gmodels) library(ggpubr) library(ggplot2) library(ggthemes) data<-read.csv("C:/Users/Administrator/Desktop/I.csv",header = T,row.names = 1) head(data)#每一列爲一個樣本,每一行爲一個基因 #計算PCA pca.info <- fast.prcomp(data) ??fast.prcomp() #顯示PCA計算結果 head(pca.info$rotation) #計算Y1與Y28之間的差別 pca.data <- data.frame(sample = rownames(pca.info$rotation),Type = c(rep("1d",3),rep("28d",3)),pca.info$rotation) #繪圖 ggscatter(pca.data,x = "PC1",y = "PC2",color = "Type") + theme_base() ###其它圖形修飾參數本身摸索吧,哈哈~ ************************************************************************************************************************
- 結果圖 從圖片來看,第一天間樣本重複性較好,28d的就不行了,都聚不到一塊。
更多信息可見:PCA分析資料ui