漫步數理統計十五——兩個隨機變量的分佈

接下里咱們討論兩個隨機變量的例子。連續擲三次硬幣並考慮有序數對(前兩次 H 的個數,三次中 H 的個數),其中 H,T 分別表示正面與反面,那麼樣本空間是 C={c:c=ci,i=1,2,,8} ,其中 c1 TTT c2 TTH c3 THT c4 HTT c5 THH c6 HTH c7 HHT c8 HHH ,令 X1 X2 是兩個函數,使得 X1(c1)=X1(c2)=0,X1(c3)=X1(c4)=X1(c5)=X1(c6)=1,X1(c7)=X1(c8)=2 X2(c1)=0,X2(c2)=X2(c3)=X2(c4)=1,X2(c5)=X2(c6)=X2(c7)=2,X2(c8)=3
那麼 X1,X2 是定義在樣本空間 C 上的實值函數,從樣本空間映射到有序數對空間
web

D={(0,0),(0,1),(1,1),(1,2),(2,2),(2,3)}

X1,X2 是定義在樣本空間 C 上的兩個隨機變量,在本例中,這些隨機變量的空間是二維集合 D ,它是二維歐幾里得空間 R2 的子集,這裏 (X1,X2) 是從 C D 的向量,如今咱們形式化隨機向量的定義。svg

1 (隨機向量)給定一個樣本空間爲 C 的隨機試驗,考慮兩個隨機變量 X1,X2 ,對 C 中的每一個元素c只分配一個有序數對 X1(c)=x1,X2(c)=x2 ,那麼咱們稱 (X1,X2) 是一個隨機向量。 (X1,X2) 的空間是有序數對 D={(x1,x2):x1=X1(c),x2=X2(c),cC} 的集合。函數

咱們經常使用向量符號 X=(X1,X2) ,其中 表示行向量 (X1,X2) 的轉置。atom

D 是隨機向量 (X1,X2) 關聯的空間, A D 的一個子集,與隨機變量同樣咱們稱爲事件 A ,咱們想定義事件 A 的機率,用 PX1,X2[A] 表示,一樣咱們用累加分佈函數(cdf)來定義 PX1,X2 ,那麼對任意 (x1,x2)R2
spa

FX1,X2(x1,x2)=P[{X1x}{X2x2}]

由於 X1,X2 是隨機變量,因此上面相加事件中的每一個事件都是原始樣本空間 C 中的事件,所以上面的表達式是明確的。與隨機變量同樣,咱們能夠將 P[{X1x1}{X2x2}] 寫成 P[X1x1,X2x2] ,而且
3d

P[a1<X1b1,a2<X2b2]=FX1,X2(b1,b2)FX1,X2(a1,b2)FX1,X2(b1,a2)+FX1,X2(a1,a2)

所以全部形如 (a1,b1]×(a2,b2] 集合的機率能夠用cdf的形式表述出來, R2 中這種形式的集合生成了 R2 子集的博萊爾 σ 域,cdf惟一地肯定一個 R2 上的機率,咱們常稱這種cdf爲 (X1,X2) 的聯合累積分佈函數。code

與隨機變量同樣,咱們主要關係兩種類型的隨機向量,即離散與連續,首先討論離散狀況。orm

隨機向量 (X1,X2) ,若是它的空間 D 是有限的或可數的,那麼咱們稱它是離散隨機向量,所以 X1,X2 都是離散的,對於全部的 (x1,x2)D (X1,X2) 的聯合機率質量函數(pmf)定義爲
xml

pX1,X2=P[X1=x1,X2=x2]

與隨機變量同樣,pmf惟一的肯定cdf,它也能夠用兩個性質表徵:
blog

(i)0pX1,X2(x1,x2)1(ii)ΣΣDpX1,X2(x1,x2)=1

對於事件 BD ,咱們有

P[(X1,X2)B]=BpX1,X2(x1,x2)

1 考慮定義在文章開頭實例中的離散隨機向量 (X1,X2) ,咱們能夠用下表表示其pmf:


這裏寫圖片描述

表格橫向的 0,1,2,3 表示 X2 的支撐,縱向 0,1,2 表示 X1 的支撐。

這樣也便於敘述離散隨機向量 (X1,X2) 的支撐,他們是 (X1,X2) 空間中使得 p(x1,x2)>0 的全部點 (x1,x2) ,上面的例子中支撐是由六個點 {(0,0),(0,1),(1,1),(1,2),(2,2),(2,3)} 組成的。

對於空間爲 D 的隨機向量 (X1,X2) ,若是它的cdf FX1,X2(x1,x2) 是連續的,那麼咱們稱該隨機向量是連續的。在之後的文章中,有cdf的連續隨機向量用非負函數的積分表示,即對於全部的 (x1,x2)R2,FX1,X2(x1,x2) 能夠表示成

FX1,X2(x1,x2)=x1x2fX1,X2(w1,w2)dw1dw2

咱們稱被積部分爲 (X1,X2) 的聯合機率密度函數(pdf),對於 fX1,X2(x1,x2) 連續的點,咱們有

2FX1,X2(x1,x2)x1x2=fX1,X2(x1,x2)

pdf基本可有兩個性質表徵:

(i)fX1,X2(x1,x2)0(ii)DfX1,X2(x1,x2)dx1dx2=1

對於事件 AD ,咱們有

P[(X1,X2)A]=AfX1,X2(x1,x2)dx1dx2

注意 P[(X1,X2)A] 僅僅是集合 A 上曲面 z=fX1,X2(x1,x2) 下方的體積。

與單隨機變量同樣,咱們常常省略cdf,pdf與pmf中的下標 (X1,X2) ,咱們也經常使用符號 f12 而不是 fX1,X2 。除了 (X1,X2) ,咱們也經常使用 (X,Y) 表示隨機向量。

2

f(x1,x2)={6x21x200<x1<1,0<x2<1elsewhere

是兩個連續隨機變量 X1,X2 的pdf,那麼咱們有

P(0<X1<34,13<X2<2)=21/33/40f(x1,x2)dx1dx2=11/33/406x21x2dx1dx2+213/400dx1dx2=38+0=38

注意這個機率是矩形集合 {(x1,x2):0<x1<34,13<x2<1}R2 上曲面 f(x1,x2)=6x21x2 下的體積。

對於連續隨機向量 (X1,X2) (X1,X2) 的支撐包含全部 f(x1,x2)>0 的點,咱們用 S 表示隨機向量的支撐,與單變量同樣 SD

對於 R2 上pdf fX1,X2(x1,x2) 的定義,咱們經過將其餘地方設爲零進行擴展,這樣的話就能夠避免麻煩的 D ,這樣的話咱們就能將

DfX1,X2(x1,x2)dx1dx2

替換爲

fX1,X2(x1,x2)dx1dx2

離散狀況一樣如此,可將

DpX1,X2(x1,x2)

替換爲

x2x1pX1,X2(x1,x2)

最後若是一個或多個變量的pmf或者pdf已經顯示的給定,那麼經過觀察就能看出隨機變量是離散仍是連續類型,例如顯然

p(x,y)={94x+y0x=1,2,3,,y=1,2,3,elsewhere

是兩個離散變量 X,Y 的pmf,而

f(x,y)={4xyex2y200<x<,0<y<elsewhere

顯然是兩個連續隨機變量 X,Y 的pdf。

(X1,X2) 是隨機向量,那麼 X1,X2 每個都是隨機變量,咱們用 (X1,X2) 的聯合分佈形式獲得他們的分佈,回憶一下定義在 x1 X1 cdf的事件是 {X1x1} ,然而

{X1x1}={X1x1}{<X2<}={X1x1,<X2<}

取機率得對於全部的 x1R

FX1(x1)=P[X1x1,<X2<]

將上式重寫成 FX1(x1)=limx2F(x1,x2) ,由此咱們獲得cdf之間的關係,根據 (X1,X2) 是離散的或連續的,咱們能夠將其擴展到pmf或者pdf。

首先考慮離散狀況,令 DX1 X1 的支撐,對於 x1DX1 ,上式等價於

FX1(x1)=w1x1<x2<pX1,X2(w1,x2)=w1x1x2<pX1,X2(w1,x2)

根據cdf的惟一性,括號中的量確定是 X1 w1 處的pmf;即對於全部的 x1DX1

pX1(x1)=x2<pX1,X2(x1,x2)

注意,爲了找出 X1 x1 的機率,保持 x1 不變而後在全部 x2 上求和 pX1,X2 ,以下表所示。表的最後一行是 X2 的pmf,最後一列是 X1 的pmf,通常而言,由於這些分佈記錄在表的邊緣,因此咱們常稱他們爲邊緣pmf。


這裏寫圖片描述

3 考慮一個隨機試驗,從包含10個一樣大小球的盒子中隨機抽一個球,每一個球上標有數字對,一個爲 (1,1) ,一個爲 (2,1) ,兩個爲 (3,1) ,一個爲 (1,2) ,兩個爲 (2,2) ,三個爲 (3,2) 。令隨機變量 X1,X2 分別表示有序對的第一個與第二個數,那麼 X1,X2 的聯合pmf p(x1,x2) 以下表所示,其中 p(x1,x2) 在其餘地方等於零。


這裏寫圖片描述

每行與每列的聯合機率進行相加,這些邊緣的和分別給出了 X1,X2 的邊緣機率密度函數,注意爲了求出他們咱們不必知道 p(x1,x2)

接下來考慮連續狀況,令 DX1 表示 X1 的支持,對於 x1DX1

FX1=x1fX1,X2(w1,x2)dx2dw1=x1{fX1,X2(w1,x2)dx2}dw1

根據cdf的惟一性,括號中的量必定是 X1 w1 處的pdf;即對全部 x1D_{X_1}

fX1(x1)=fX1,X2(x1,x2)dx2

所以對於連續狀況, X1 的pdf經過積分 x2 獲得,一樣的 x2 的pdf能夠經過積分 x1 獲得。

4 X1,X2 的聯合pdf爲

f(x1,x2)={x1+x200<x1<1, 0<x2<1elsewhere

X1 的邊緣pdf爲

f1(x1)=10(x1+x2)dx2=x1+12,0<x1<1

其餘地方爲零, X2 的邊緣pdf爲

f1(x1)=10(x1+x2)dx2=12+x2,0<x2<1

其餘地方爲零。像 P(X112) 的機率既能夠從 f1(x1) 也能夠從 f(x1,x2) 中計算獲得,由於

1/2010f(x1,x2)dx2dx1=1/20f1(x1)dx1=38

然而爲了求出像 P(X1+X21) ,咱們必須用聯合pdf f(x1,x2) ,以下所示:

101x10(x1+x2)dx2dx1=10[x1(1x1)+(1x1)22]dx1=10(1212x21)dx1=13

這個機率就是集合 {(x1,x2):0<x1,x1+x21} 上曲面 f(x1,x2)=x1+x2 下的體積。

(X1,X2) 是一個隨機向量, Y=g(X1,X2) 是某個實值函數,即 g:R2R ,那麼 Y 是一個隨機變量且經過 Y 的分佈能夠肯定它的指望。

假設 (X1,X2) 是連續類型,那麼若是

|g(x1,x2)|fX1,X2(x1,x2)dx1dx2<

E(Y) 存在,

E(Y)=g(x1,x2)fX1,X2(x1,x2)dx1dx2

相似的,若是 (X1,X2) 是離散的,那麼若是

x1x2|g(x1,x2)|pX1,X2(x1,x2)dx1dx2<

E(Y) 存在,

E(Y)=x1x2g(x1,x2)pX1,X2(x1,x2)dx1dx2

如今咱們說明 E 是一個線性運算。

1 (X1,X2) 是一個隨機向量, Y1=g1(X1,X2),Y2=g2(X1,X2) 是隨機變量,其指望存在,那麼對任意實數 k1,k2

E(k1Y1+k2Y2)=k1E(Y1)+k2E(Y2)

咱們證實連續狀況。 k1Y1+k2Y2 指望值的存在性直接從三角不等式以及積分的線性能夠求出,即

|k1g1(x1,x2)+k2g1(x1,x2)|fX1,X2(x1,x2)dx1dx2|k1||g1(x1,x2)|fX1,X2(x1,x2)dx1dx2+|k2||g2(x1,x2)|fX1,X2(x1,x2)dx1dx2<

利用積分的線性可得

E(k1Y1+k2Y2)=[k1g1(x1,x2)+k2g2(x1,x2)]fX1,X2(x1,x2)dx1dx2=k1g1(x1,x2)fX1,X2(x1,x2)dx1dx2+k2g2(x1,x2)fX1,X2(x1,x2)dx1dx2=k1E(Y1)+k2E(Y2)

得證。

注意對於 X2 的任意函數 g(X2) 的指望能夠經過兩種方式獲得:

E(g(X2))=g(x2)f(x1,x2)dx1dx2=g(x2)fX2(x2)dx2

最後的式子是經過先積分 x1 獲得的,下面的例子說明了這個想法。

5 X1,X2 的pdf爲

f(x1,x2)={8x1x200<x1<x2<1elsewhere

那麼

E(X1X22)=x1x22f(x1,x2)dx1dx2=10x2)8x21x32dx1dx2=1083x62dx2=821

另外

E(X2)=10x20x2(8x1x2)dx1dx2=45

由於 X2 的pdf f2(x2)=4x32,,0<x2<1 ,其餘地方爲零,後者的指望能夠用

E(X2)=10x2(4x32)dx2=45

求出,所以

E(7X1X22+5X2)
相關文章
相關標籤/搜索