RNA-seq表達數據之樣本PCA分析

Principal component analysis (PCA) 分析

主成分分析(PCA)幫助咱們概括總結和可視化數據集中的信息,這些數據包含由多個相互關聯的變量描述的個體 / 觀察主成分分析。 能夠將每一個變量視爲不一樣的維度。 但若是您的數據集中有3個以上的變量,那麼很難在多維超空間可視化。 主成分分析是用來從一個多變量數據表中提取重要信息,並將這些信息表示爲一組稱爲主成分的新變量。 這些新的變量至關於原始數據的線性組合。 主成分的個數小於或等於原始變量的個數。 給定數據集中的信息對應於它所包含的總變差。 主成分分析的目的是肯定數據變化最大的方向(或主成分)。換句話說,主成分分析將多變量數據的維數下降爲兩個或三個主成分,這些主成分能夠以圖形化的方式顯示,信息損失最小。轉錄組中,通常用來檢驗不一樣處理組樣本間重複性的好壞。更多PCA原理及分析方法請點擊文末的PCA分析資料,下面小編用本身的數據在R中進行PCA分析。ide

PCA可視化

  • 數據展現 1d和28d差別表達基因
  • 代碼展現
******************************************************************************************************
#### RNA-seq樣本PCA分析####
#加載的R包
install.packages(c("ggpubr","ggthemes","gmodels"))
library(ggpubr)
#加載差別基因表達矩陣
library(gmodels)
library(ggpubr)
library(ggplot2)
library(ggthemes)
data<-read.csv("C:/Users/Administrator/Desktop/I.csv",header = T,row.names = 1)
head(data)#每一列爲一個樣本,每一行爲一個基因
#計算PCA
pca.info <- fast.prcomp(data)
??fast.prcomp()
#顯示PCA計算結果
head(pca.info$rotation)
#計算Y1與Y28之間的差別
pca.data <- data.frame(sample = rownames(pca.info$rotation),Type = c(rep("1d",3),rep("28d",3)),pca.info$rotation)
#繪圖
ggscatter(pca.data,x = "PC1",y = "PC2",color = "Type") + theme_base()
###其它圖形修飾參數本身摸索吧,哈哈~
************************************************************************************************************************
  • 結果圖 PCA結果圖 從圖片來看,第一天間樣本重複性較好,28d的就不行了,都聚不到一塊。

更多信息可見:PCA分析資料ui

相關文章
相關標籤/搜索