RNA-seq表達數據之樣本PCA分析

Principal component analysis (PCA) 分析

主成分分析(PCA)幫助咱們概括總結和可視化數據集中的信息，這些數據包含由多個相互關聯的變量描述的個體 / 觀察主成分分析。能夠將每一個變量視爲不一樣的維度。但若是您的數據集中有3個以上的變量，那麼很難在多維超空間可視化。主成分分析是用來從一個多變量數據表中提取重要信息，並將這些信息表示爲一組稱爲主成分的新變量。這些新的變量至關於原始數據的線性組合。主成分的個數小於或等於原始變量的個數。給定數據集中的信息對應於它所包含的總變差。主成分分析的目的是肯定數據變化最大的方向(或主成分)。換句話說，主成分分析將多變量數據的維數下降爲兩個或三個主成分，這些主成分能夠以圖形化的方式顯示，信息損失最小。轉錄組中，通常用來檢驗不一樣處理組樣本間重複性的好壞。更多PCA原理及分析方法請點擊文末的PCA分析資料，下面小編用本身的數據在R中進行PCA分析。ide

PCA可視化

數據展現
代碼展現

******************************************************************************************************
#### RNA-seq樣本PCA分析####
#加載的R包
install.packages(c("ggpubr","ggthemes","gmodels"))
library(ggpubr)
#加載差別基因表達矩陣
library(gmodels)
library(ggpubr)
library(ggplot2)
library(ggthemes)
data<-read.csv("C:/Users/Administrator/Desktop/I.csv",header = T,row.names = 1)
head(data)#每一列爲一個樣本，每一行爲一個基因
#計算PCA
pca.info <- fast.prcomp(data)
??fast.prcomp()
#顯示PCA計算結果
head(pca.info$rotation)
#計算Y1與Y28之間的差別
pca.data <- data.frame(sample = rownames(pca.info$rotation),Type = c(rep("1d",3),rep("28d",3)),pca.info$rotation)
#繪圖
ggscatter(pca.data,x = "PC1",y = "PC2",color = "Type") + theme_base()
###其它圖形修飾參數本身摸索吧，哈哈~
************************************************************************************************************************

結果圖從圖片來看，第一天間樣本重複性較好，28d的就不行了，都聚不到一塊。

更多信息可見：PCA分析資料ui