北京理工大學計算機專業2016級碩士在讀,方向:Machine Learning,NLP,DM
本講大綱:
1.牛頓方法(Newton’s method)
2.指數族(Exponential family)
3.廣義線性模型(Generalized linear models)html
牛頓法
以上分佈都是指數分佈族的特例
指數族形式:
η
被稱爲分佈的
天然參數
(natural parameter)
;
T(y)是
充分統計量
(sufficient statistic)(對於咱們考慮的分佈來講,一般T(y)=y);
a(η)是日誌分配函數(log partition function),e
-a(η)
是一個規範化常數,使得分佈的和爲1.
給定函數T,a,b,經過改變參數η獲得不一樣的分佈。
下面展現伯努利(Bernoulli)和高斯分佈(Gaussian distribution)都是指數分佈族的特例:
回憶咱們對線性迴歸求導時,方差對咱們最終結果並無任何影響.爲了使問題簡化,令因而有,
得:
指數分佈族還包括不少其餘的分佈:
多項式分佈(multinomial) : 對k個結果的事件建模
泊松分佈(poisson):用於計數過程建模
伽馬分佈(gamma),指數分佈(exponential):用於對連續非負的隨機變量進行建模
β分佈,Dirichlet分佈:對小數建模
Wishart分佈:協方差矩陣的分佈
廣義線性模型 (GLM)
爲了導出GLM,做三個假設:
(1)
(2)給定x,咱們的目標是預測T(y)的預期值. 在大部分例子中,咱們有T(y)=y,所以意味着咱們經過學習獲得的假設知足
(這個假設對logistic迴歸和線性迴歸都成立)
(3)天然參數和輸入變量是線性相關的,也就是說
(天然參數大可能是實數,若是天然參數是向量,則
)
3.1普通的最小二乘法
爲了說明普通的最小二乘法是GLM的特例,設定目標變量y(在GLM術語中叫響應變量-response variable)是連續的,而且假設服從高斯分佈
,高斯分佈寫成指數族的形式,有
獲得:
3.2 logistic迴歸
考慮logistic,咱們感興趣的是二元分類,也就是說
很容易想到指數分佈族的伯努利分佈,有
,同理獲得:
正則響應函數(canonical response function):
正則鏈接函數(canonical link function):
3.3 softmax 迴歸 日誌
當分類問題的y取值不止兩個時,咱們須要採用
多項式分佈(multinomial distribution)
.
在推導多項式分佈的GLM以前,先把多項式分佈表達成指數族.爲了參數化多項式分佈的k各可能結果,有人可能會用k個參數來講明每一種狀況的可能性,可是這些參數是冗餘的,而且並非獨立的(因爲知道任何其中的k-1個,剩下的一個就能夠求出,由於知足
). 所以咱們用k-1個參數
對多項分佈進行參數化,
.
這裏T(y) <> y。
定義
,以下,
介紹一個頗有用的記號(指示函數),
,例如1{2=3}=0,1{3=5-2}=1.
所以T(y)和y的關係爲
.
補充: 機率分佈函數、機率密度函數、機率質量函數
- 機率分佈函數. Accumulative Distribution Function. ADF(X能夠是連續的, 也能夠是離散的隨機變量.)
- 機率密度函數. Probability Density Function. PDF.(爲連續隨機變量定義的)
它自己不是一個機率值,能夠大於1,在x積分後纔是機率值。
- 機率質量函數. Probability Mass Function. PMF. (爲離散型隨機變量定義的)
Tips:
一、它自己就是一個機率值.
對於連續型隨機變量, 它任意一個肯定x
值的機率值都是0, 即:
二、而對離散型隨機變量, 它在任意一個x值
的機率值就是它的PMF.
補充:統計中的分佈
1. 伯努利分佈(兩點分佈、0-1 分佈)
- 描述的是一種隨機試驗(結果只有成功或失敗,可能性是固定的p)發生的機率,屬於離散型機率分佈
- 若是試驗E是一個伯努利試驗,將E獨立重複地進行n次,則稱這一串重複的獨立試驗爲n重伯努利試驗。
- 進行一次伯努利試驗,成功(X=1)機率爲p(0<=p<=1),失敗(X=0)機率爲1-p,則稱隨機變量X服從伯努利分佈。
- 伯努利試驗是隻有兩種可能結果的單次隨機試驗,即對於一個隨機變量X而言:
- 機率質量函數: 其中 k=0,1
- 方差:
2. 二項分佈(n 重伯努利分佈)
- 二項分佈(Binomial distribution)是n重伯努利試驗成功次數的離散型機率分佈。
- 若是試驗E是一個n重伯努利試驗,每次伯努利試驗的成功機率爲p,X表明成功的次數,則X的機率分佈是二項分佈,記爲X~B(n,p),其機率質量函數爲
- 二項分佈名稱的由來,是因爲其機率質量函數中使用了二項係數,該係數是二項式定理中的係數,二項式定理由牛頓提出:
- 二項分佈的典型例子是扔硬幣,硬幣正面朝上機率爲p, 重複扔n次硬幣,k次爲正面的機率即爲一個二項分佈機率。
3.高斯分佈(正態分佈)
- 若隨機變量X服從一個數學指望爲μ、標準方差爲σ2的高斯分佈,記爲:
-
X∼N(μ,σ2),
-
-
4.多項分佈
- 多項式分佈(Multinomial Distribution)是二項式分佈的推廣。二項式作n次伯努利實驗,規定了每次試驗的結果只有兩個,若是如今仍是作n次試驗,只不過每次試驗的結果能夠有多m個,且m個結果發生的機率互斥且和爲1,則發生其中一個結果X次的機率就是多項式分佈。
- 扔骰子是典型的多項式分佈。扔骰子,不一樣於扔硬幣,骰子有6個面對應6個不一樣的點數,這樣單次每一個點數朝上的機率都是1/6(對應p1~p6,它們的值不必定都是1/6,只要和爲1且互斥便可,好比一個形狀不規則的骰子),重複扔n次,若是問有k次都是點數6朝上的機率就是
-