方差、標準差、協方差、相關係數

【方差】.net

  (variance)是在機率論和統計方差衡量 隨機變量或一組數據時離散程度的度量。機率論中方差用來度量 隨機變量和其 數學指望(即 均值)之間的偏離程度。統計中的方差(樣本方差)是每一個樣本值與全體樣本值的平均數之差的平方值的 平均數。在許多實際問題中,研究方差即偏離程度有着重要意義。方差是衡量源數據和指望值相差的度量值。(百度百科)
  
  在統計描述中,方差用來計算每個變量(觀察值)與整體均數之間的差別。爲避免出現離均差總和爲零,離均差平方和受樣本含量的影響,統計學採用平均離均差平方和來描述變量的變異程度。整體方差計算公式:
               

  實際工做中,整體均數難以獲得時,應用樣本統計量代替整體參數,經校訂後,樣本方差計算公式:翻譯

  S^2= ∑(X-  ) ^2 / (n-1)     S^2爲樣本方差,X爲變量,  爲樣本均值,n爲樣本例數。(無偏估計)orm

【標準差】對象

  標準差(Standard Deviation) ,中文環境中又常稱均方差,是離均差平方的算術平均數的平方根,用σ表示。標準差是方差的算術平方根。標準差能反映一個數據集的離散程度。平均數相同的兩組數據,標準差未必相同。標準差也被稱爲標準誤差,或者實驗標準差,公式爲blog

     
【協方差】
  能夠通俗的理解爲:兩個變量在變化過程當中是同方向變化,仍是反方向變化,同向或反向程度如何?
  你變大,同時我也變大,說明兩個變量是同向變化的,這時協方差就是正的。
  你變大,同時我變小,說明兩個變量是反向變化的,這時協方差就是負的。
  從數值來看,協方差的數值越大,兩個變量同向程度也就越大。反之亦然。
  
  公式簡單翻譯一下是:若是有X,Y兩個變量,每一個時刻的「X值與其均值之差」乘以「Y值與其均值,(實際上是求「指望」,但就不引伸太多新概念了,簡單認爲就是求均值了)。
【相關係數】
  相關關係是一種非肯定性的關係,相關係數是研究變量之間 線性相關程度的量。因爲研究對象的不一樣,相關係數有以下幾種定義方式。簡單相關係數:又叫相關係數或線性相關係數,通常用字母r 表示,用來度量兩個變量間的線性關係。
     就是用X、Y的協方差除以X的標準差和Y的標準差。 因此,相關係數也能夠當作協方差:一種剔除了兩個變量量綱影響、標準化後的特殊協方差。
  既然是一種特殊的協方差,那它:
  一、也能夠反映兩個變量變化時是同向仍是反向,若是同向變化就爲正,反向變化就爲負。
  二、因爲它是標準化後的協方差,所以更重要的特性來了:它消除了兩個變量變化幅度的影響,而只是單純反應兩個變量每單位變化時的類似程度。

 【參考文獻】get

https://www.zhihu.com/question/20852004數學

https://baike.baidu.com/item/%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/3109424?fr=aladdinit

https://blog.csdn.net/u010182633/article/details/45921929io

https://www.zhihu.com/question/20099757form

相關文章
相關標籤/搜索