協方差的意義

協方差表明了兩個變量之間的是否同時偏離均值。.net

3a6f9c262fc67167d50742c3.png 

若是正相關,這個計算公式,每一個樣本對(Xi, Yi), 每一個求和項大部分都是正數,即兩個同方向偏離各自均值,而不一樣時偏離的也有,可是少,這樣當樣本多時,總和結果爲正。下面這個圖就很直觀。下面轉載自:http://blog.csdn.net/wuhzossibility/article/details/8087863blog

 

在機率論中,兩個隨機變量 X 與 Y 之間相互關係,大體有下列3種狀況:ip

 

當 X, Y 的聯合分佈像上圖那樣時,咱們能夠看出,大體上有: X 越大  Y 也越大, X 越小  Y 也越小,這種狀況,咱們稱爲「正相關」。get

 

當X, Y 的聯合分佈像上圖那樣時,咱們能夠看出,大體上有:X 越大Y 反而越小,X 越小 Y 反而越大,這種狀況,咱們稱爲「負相關」。it

當X, Y  的聯合分佈像上圖那樣時,咱們能夠看出:既不是X  越大Y 也越大,也不是 X 越大 Y 反而越小,這種狀況咱們稱爲「不相關」。

怎樣將這3種相關狀況,用一個簡單的數字表達出來呢?class

在圖中的區域(1)中,有 X>EX ,Y-EY>0 ,因此(X-EX)(Y-EY)>0;變量

在圖中的區域(2)中,有 X<EX ,Y-EY>0 ,因此(X-EX)(Y-EY)<0;im

在圖中的區域(3)中,有 X<EX ,Y-EY<0 ,因此(X-EX)(Y-EY)>0;img

在圖中的區域(4)中,有 X>EX ,Y-EY<0 ,因此(X-EX)(Y-EY)<0。di

當X 與Y 正相關時,它們的分佈大部分在區域(1)和(3)中,小部分在區域(2)和(4)中,因此平均來講,有E(X-EX)(Y-EY)>0 。

當 X與 Y負相關時,它們的分佈大部分在區域(2)和(4)中,小部分在區域(1)和(3)中,因此平均來講,有(X-EX)(Y-EY)<0 。

當 X與 Y不相關時,它們在區域(1)和(3)中的分佈,與在區域(2)和(4)中的分佈幾乎同樣多,因此平均來講,有(X-EX)(Y-EY)=0 。

因此,咱們能夠定義一個表示X, Y 相互關係的數字特徵,也就是 協方差
cov(X, Y) = E(X-EX)(Y-EY)。

當 cov(X, Y)>0時,代表 X與Y 正相關;

當 cov(X, Y)<0時,代表X與Y負相關;

當 cov(X, Y)=0時,代表X與Y不相關。

這就是協方差的意義。

相關文章
相關標籤/搜索