協方差表明了兩個變量之間的是否同時偏離均值。.net
若是正相關,這個計算公式,每一個樣本對(Xi, Yi), 每一個求和項大部分都是正數,即兩個同方向偏離各自均值,而不一樣時偏離的也有,可是少,這樣當樣本多時,總和結果爲正。下面這個圖就很直觀。下面轉載自:http://blog.csdn.net/wuhzossibility/article/details/8087863blog
在機率論中,兩個隨機變量 X 與 Y 之間相互關係,大體有下列3種狀況:ip
當 X, Y 的聯合分佈像上圖那樣時,咱們能夠看出,大體上有: X 越大 Y 也越大, X 越小 Y 也越小,這種狀況,咱們稱爲「正相關」。get
當X, Y 的聯合分佈像上圖那樣時,咱們能夠看出,大體上有:X 越大Y 反而越小,X 越小 Y 反而越大,這種狀況,咱們稱爲「負相關」。it
怎樣將這3種相關狀況,用一個簡單的數字表達出來呢?class
在圖中的區域(1)中,有 X>EX ,Y-EY>0 ,因此(X-EX)(Y-EY)>0;變量
在圖中的區域(2)中,有 X<EX ,Y-EY>0 ,因此(X-EX)(Y-EY)<0;im
在圖中的區域(3)中,有 X<EX ,Y-EY<0 ,因此(X-EX)(Y-EY)>0;img
在圖中的區域(4)中,有 X>EX ,Y-EY<0 ,因此(X-EX)(Y-EY)<0。di
當X 與Y 正相關時,它們的分佈大部分在區域(1)和(3)中,小部分在區域(2)和(4)中,因此平均來講,有E(X-EX)(Y-EY)>0 。
當 X與 Y負相關時,它們的分佈大部分在區域(2)和(4)中,小部分在區域(1)和(3)中,因此平均來講,有(X-EX)(Y-EY)<0 。
當 X與 Y不相關時,它們在區域(1)和(3)中的分佈,與在區域(2)和(4)中的分佈幾乎同樣多,因此平均來講,有(X-EX)(Y-EY)=0 。
因此,咱們能夠定義一個表示X, Y 相互關係的數字特徵,也就是 協方差當 cov(X, Y)>0時,代表 X與Y 正相關;
當 cov(X, Y)<0時,代表X與Y負相關;
當 cov(X, Y)=0時,代表X與Y不相關。
這就是協方差的意義。