摘要:最近在學習機器學習/數據挖掘的算法,在看一些paper的時候常常會遇到之前學過的數學公式或者名詞,又是老是想不起來,因此在此記錄下本身的數學複習過程,方便後面查閱。算法
數學指望是隨機變量的重要特徵之一,隨機變量X的數學指望記爲E(X),E(X)是X的算術平均的近似值,數學指望表示了X的平均值大小。機器學習
數學指望給出了隨機變量的平均大小,現實生活中咱們還常常關心隨機變量的取值在均值周圍的散佈程度,而方差就是這樣的一個數字特徵。學習
設X是隨機變量,而且E{[X-E(X)2]}存在,則稱它爲X的方差,記爲D(X)。3d
另外,D(X) = E{[X-E(X)2]} 通過化解可得 D(X) = E(X2) – [E(X)]2 .咱們通常計算的時候經常使用這個式子。get
對於二維的隨機變量(X,Y),咱們還要討論它們的相互關係,協方差就是一個這樣的數字特徵。數學
由於E{[X-E(X)][Y-E[Y]]} = E(XY) – E(X)E(Y).it
又當X,Y相互獨立的時候E(XY) = E(X)E(Y).這意味着若E{[X-E(X)][Y-E[Y]]} ≠ 0 ,則X與Y是存在必定關係的。數據挖掘
咱們把E{[X-E(X)][Y-E[Y]]} 稱爲隨機變量X與Y的協方差。記爲Cov(X,Y).變量
即:Cov(X,Y) = E{[X-E(X)][Y-E[Y]]}
協方差在某種意義上是表示了兩個隨機變量間的關係,可是Cov(X,Y)的取值大小與X,Y的量綱有關,不方便分析,因此爲了不這一點,咱們用X,Y的標準化隨機變量來討論。
其中爲X,Y的協方差即Cov(X,Y),D(X),D(Y)分別是X,Y的方差且D(X)>0,D(Y)>0。
關於相關係數,咱們有下面的性質:
注意:兩個不相關的隨機變量,不必定相互獨立,有一特殊狀況是,當隨機變量X,Y服從二維正態分佈的時候,獨立與不相關等價。
矩(moment)是最普遍的一種數字特徵,經常使用的矩有兩種:原點矩和中心矩。
原點矩:
對於正整數k,稱隨機變量X的k次冪的數學指望爲X的k階原點矩:即 E(Xk) ,k=1,2,…n.
數學指望就是一階原點矩。
中心矩:
對於正整數k,稱隨機變量X與E(X)差的k次冪的數學指望爲X的k階中心矩:即 E{X-E[XK]},K=1,2,…n.
方差就是二階中心矩。