出處:http://www.cnblogs.com/bigmonkey
本文以學習、研究和分享爲主,如需轉載,請聯繫本人,標明做者和出處,非商業用途!
掃描二維碼關注公衆號「我是8位的」
和其它問題同樣,機率也可能同時受到多個條件的影響,例如考察某地區中學生的身體素質,隨機地選取一名學生,觀察學生的身高 X,體重 Y 和肺活量 Z 等指標。隨機變量 X,Y,Z 來自同同樣本空間,它們的取值可能相互影響。像這樣同時考慮的多個隨機變量,稱爲多維隨機變量。本章以二維隨機變量爲例,介紹多維隨機變量的相關概念。函數
和一維變量的機率分佈相似,聯合分佈把舞臺擴展到了多維,這裏的「聯合」就是多個隨機變量的意思。post
假設一個事件受到兩個變量x和y的影響,它的聯合分佈定義爲:學習
其中X表示具體的取值,x表示變量。spa
上一章提到過,分佈是指機率的累加,是把事件映射爲數字,一個二維聯合分佈的變量取值範圍是整個二維平面,但F(x,y)的取值範圍是0~1。3d
聯合機率指的是包含多個條件且全部條件同時成立的機率,也叫聯合分佈率。blog
用xi和yj的兩個隨機變量全部可能的取值,P(X=xi, Y=yj)表示在X=xi和Y=yj下事件發生的機率。設P(X=xi, Y=yj)=pij,則下表是二維離散型隨機變量(X, Y)的聯合機率:事件
聯合分佈率其實是一個矩陣。既然是機率,聯合機率也知足下面兩個條件:get
一維隨機變量的分佈函數:class
二維隨機變量的分佈函數:變量
其中:
分佈函數和分佈略有區別,「分佈」是指累加機率,「分佈函數」是將累加機率函數化。F(x,y)=P{X≤x,Y≤y}是分佈函數,它的值是全部在X≤x,Y≤y下的機率分佈。
先看錶1的第一行,它固定了x=x1,此時在表格右側加入一列:
p1·表示x的取值固定,y取任意值時的機率分佈,即:
因爲p1·是寫在表格的邊緣,因此稱爲x=x1的邊緣分佈。對於任意行來講:
這其實是在表示X= xi時事件發生的機率。相似的,y=yj的邊緣分佈是:
條件機率是指在A事件發生的條件下,事件B發生的機率,表示爲P(B|A),它有一個重要公式:
多維隨機變量的條件機率公式與此相似,在Y=yj 條件下X=xi的機率:
對於二維離散型隨機變量(X, Y)來講,若是知足:
那麼這兩個隨機變量之間是沒有相互影響的,稱X和Y之間互相獨立。反過來也同樣,若是知足了獨立性,那麼必然有上式的關係。
因爲是連續型變量,因此沒法像離散型變量那樣簡單地計算在某一點的機率(機率能夠表示爲幾何度量,點的度量是0,所以算某一點的機率也是0,或者說計算點的機率沒有意義),只能計算某一取值範圍內的機率,也就是機率分佈(機率的累加)。
某個地區的人口密度越大,這個地區的人口越多。一樣的,機率密度越大,說明這個區域的發生某件事的機率越大。
設F(x,y)是二維連續型隨機變量(X,Y)的聯合分佈函數,若是存在一個非負函數f(x,y),對於任意實數x,y,有:
則稱f(x,y)是二維連續型隨機變量(X,Y)的聯合機率密度函數。
u和v在計算後定積分後會被x和y代替。能夠對比上一章中一維隨機變量的分佈函數來理解F(x,y)。機率分佈是機率的累加,而累加正好是積分的定義。在幾何上,F(x,y)表示了曲面柱體的體積:
假設在R區域上,x1<x<x2, y1<y<y2,那麼該區域上的機率分佈是:
dydx是R上的面積積元,它是面積無限接近0的小矩形,但不是0。至此,機率和多重積分聯繫到一塊兒。上式中沒有u和v,這是因爲已經肯定了x和y的取值範圍,且f原本就是關於x和y的函數,所以不必再引入u和v。若是非要使用u和v,那麼上式等價於:
因爲F是分佈函數,所以在整個定義域上知足:
聯合分佈表達的是二維隨機變量(X, Y)的總體分佈,同時X和Y也有各自的邊緣分佈。與離散型相似,連續型隨機變量的邊緣分佈是隻認爲有一個變量,其它變量都看做常量。
X的邊緣分佈,表示將x看做常量,無論Y的取值:
Y的邊緣分佈,表示將y看做常量,無論x的取值:
設(X, Y)的聯合密度函數是f(x,y),那麼(X, Y)的聯合分佈能夠表示爲:
X的邊緣分佈限定了X的取值是X≤x,y能夠取任意值,此時X的邊緣分佈能夠寫成:
分佈表明了累加,連續型分佈是用積分表示的,FX(x)表示P{X≤x, Y<∞}的累加,是對dx的積分,所以X的邊緣分佈的密度函數是上式的內積分:
把u,v換成x,y,X的邊緣分佈的密度函數是:
相似的,Y的邊緣分佈的密度函數是:
條件機率公式:
對於連續型變量來講,單點的機率沒有意義,所以將上式推廣到連續型隨機變量後就變成了「分佈」,好比給定Y值的條件下X的機率分佈。
設(X, Y)的聯合密度函數是f(x,y),邊緣密度函數是fX(x)和fY(y),若是固定x,則稱下式爲X=x條件下Y的機率密度:
一樣,Y=y條件下X的機率密度:
有了機率密度,天然能夠求得相應的分佈,給定Y值的條件下X的機率分佈:
對於二維連續型隨機變量(X, Y)來講,若是知足:
那麼這兩個隨機變量之間是沒有相互影響的,稱X和Y之間互相獨立。反過來也同樣,若是知足了獨立性,那麼必然有上式的關係。
設R是平面上的有界區域,面積爲A,若二維隨機變量(X,Y)具備機率密度:
則稱(X, Y)在R上服從均勻分佈。
若是在R區域上x在x1<x<x2上服從均勻分佈,那麼X在x1<x<x2的邊緣分佈的密度函數是:
若(X, Y) 服從R區域上的均勻分佈,則對於R上的任一子區域D,都有:
上式其實是在說,若是(X,Y)在某個區域內服從均勻分佈,則意味着(X,Y)在該區域內具備「等可能」性。
若二維隨機變量(X,Y)具備機率密度:
則稱(X,Y)服從參數爲 的二維正態分佈,記做:
f(x,y)的是一個倒鍾型曲面:
X服從(0,1)上的均勻分佈,在X=x(0<x<1)的條件下,Y在(0,x)內服從均勻分佈,f(x,y)=?, 2. fY(y)=?
先看1,X服從某一個區域的邊緣分佈意味着:
X服從(0,1)上的均勻分佈,則x1 = 0, x2 = 1:
「Y在(0,x)內服從均勻分佈」:
2. Y的邊緣分佈的密度函數是:
如今只須要肯定的積分域便可,由0<y<x<1可知,積分上限是1,下限是y:
設二維隨機變量(X, Y)的聯合機率密度是:
1. A=? 2.求分佈函數F(x,y) 3.求機率P{Y≤X}
1. 整個定義域上分佈函數知足:
做者:我是8位的