今天的主角是指數分佈,由此導出\(\Gamma\)分佈,一樣,讀者應嘗試一邊閱讀,一邊獨立推導出本文的結論。因爲本系列爲我獨自完成的,缺乏審閱,若是有任何錯誤,歡迎在評論區中指出,謝謝!函數
指數分佈是單參數分佈族,整體\(X\sim E(\lambda)\)有時也記做\(\mathrm{Exp}(\lambda)\),此時的整體密度函數爲學習
現尋找其充分統計量,樣本聯合密度函數爲spa
由因子分解定理,取code
能夠獲得\(\bar X\)是\(\lambda\)的充分統計量。可是指數分佈的參數並不是均值,而是均值的倒數,因此對\(\bar X\)也有數學
注意,千萬不要想固然地認爲指望和通常的函數之間是可交換的,即通常來講\(\mathbb{E}[f(X)]\ne f[\mathbb{E}(X)]\),因此你不能認爲\(\bar X^{-1}\)就是\(\lambda\)的無偏估計量。it
每到此時,我就想舉對數正態分佈的例子:\(X\sim N(0,\sigma^2)\),求\(e^{X}\)的指望。顯然有class
\[\begin{aligned} \mathbb{E}(e^{X})&=\int_{-\infty}^\infty e^x\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{x^2}{2\sigma^2} \right\}\mathrm{d}x\\ &=\int_{-\infty}^\infty \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{x^2-2\sigma^2x}{2\sigma^2} \right\}\mathrm{d}x\\ &=e^{-\frac{\sigma^2}{2}}\int_{-\infty}^\infty \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{(x-\sigma^2)^2}{2\sigma^2} \right\}\mathrm{d}x\\ &=e^{-\frac{\sigma^2}{2}}. \end{aligned} \]最後一個等號處,積分是\(N(\sigma^2,\sigma^2)\)的密度函數全積分爲1。這說明sed
\[\mathbb{E}(e^{X})=e^{-\frac{\sigma^2}{2}}\ne 1=e^{\mathbb{E}(X)}. \]
一樣,也能告訴咱們股票的波動率越大,指望收益也越大。lambda
可是,用\(\bar X^{-1}\)老是有必定道理的,至少在量級上保持了跟待估參數的一致性。若是咱們要進行無偏調整,則須要求出\(\bar X\)的具體密度。不妨設\(T=\sum_{j=1}^n X_j\),則\(T=n\bar X\),若是咱們能求出\(T\)的分佈,也同樣能得出\(\bar X^{-1}\)的指望。技巧
爲求\(T\)的分佈,引入一個Jacobi行列式爲1的線性變換:
則\((Y_{1},\cdots,Y_{n})\)的聯合密度函數爲
接下來要依次對\(y_1,\cdots,y_{n-1}\)做積分,爲方便計,記
如今,\(y_1\)的積分範圍是\((0,y_n-y_{n-1}-\cdots-y_2)=(0,\mathcal B_2)\),即
再對\(y_2\)積分,其積分範圍是\((0,\mathcal B_3)\),即
繼續下去的步驟就很機械了,對\(y_3\)積分時積分範圍是\((0,\mathcal B_4)\),因此
將這個過程一直進行下去,容易獲得
進行最後一次積分就能獲得\(T\)的密度函數爲
這裏有一個稍微有點耍賴的技巧。若是你不想一個個積分,而又記住了指數分佈和的密度函數形式,則能夠用數學概括法驗證指數分佈和的密度函數恰有如此的形式。
讀者能夠自行用數學概括法計算一遍,這個計算量是比較小的。
一樣,咱們之後會常常跟這個密度函數打交道。由於階乘只適用於整數,將其解析延拓到\(\mathbb{R}^+\)上有\((n-1)!=\Gamma(n)\),注意到其核爲\(e^{-\lambda x}x^{n-1}\),對於任意\(n>0,\lambda >0\),有
因此其正則化因子爲\(\frac{\lambda^n}{\Gamma(n)}\)。如今咱們能夠正式給出\(\Gamma\)分佈的定義:稱\(X\sim\Gamma(n,\lambda)\),若是\(X\)具備以下的密度函數:
當\(n\)爲整數時,\(\Gamma(n)=(n-1)!\)。同時,咱們獲得一個重要結論:若\(X_1,\cdots,X_n\stackrel{\mathrm{i.i.d.}}\sim E(\lambda)\),則
Tlst <- c() for (i in 1:100000){ Tlst[i] <- sum(rexp(5, 3)) # T爲5個E(3)樣本之和 } plot(density(Tlst), main = "T的樣本密度", col = "blue", xlim = c(0, 6)) xlst <- seq(0, 6, 0.00001) ylst <- dgamma(xlst, 5, 3) lines(xlst, ylst, col = "red")
因爲\(\Gamma\)分佈核函數的特色,其指望和方差也是容易求出的。現設\(X\sim \Gamma(n)\),則
這說明\(n\)越大\(X\)的指望越大,\(\lambda\)越大\(X\)的指望越小,若是將其視爲獨立指數分佈的和也能獲得這個結論。
如今回到正題,計算指數分佈均值倒數\(\bar X^{-1}\)的指望,先計算\(T^{-1}\)的指望,容易計算獲得
所以天然有
所以,\(\bar X^{-1}\)只是\(\lambda\)的漸進無偏估計,能夠對它通過無偏處理獲得無偏估計:
下面進行\(\hat \lambda\)的有偏估計、無偏估計的模擬計算,從指數分佈\(E(2)\)中抽樣。爲了體現出區別,圖中的每個點都是100個估計量的平均值。
rm(list = ls()) unbiased_estimator <- c() biased_estimator <- c() for (j in 1:100){ meanlst <- c() for (i in 1:100){ samples <- rexp(10, 2) # 每次產生10個樣本計算均值 meanlst[i] <- 1/mean(samples) } biased_estimator[j] <- mean(meanlst) unbiased_estimator[j] <- 9/10*biased_estimator[j] } split.screen(c(1, 2)) screen(1) plot(biased_estimator, main = "有偏估計", ylim = c(1.5, 2.5)) abline(h = 2, col = "blue") screen(2) plot(unbiased_estimator, main = "無偏估計", ylim = c(1.5, 2.5)) abline(h = 2, col = "blue")
\(\Gamma\)分佈與許多分佈具備緊密的聯繫(中心極限定理這種與正態分佈的聯繫就不說了)。與指數分佈的聯繫是顯然的:\(\Gamma(1,\lambda)\)就是\(E(\lambda)\),這點從上面的推導能夠得出。
須要注意一點:指數分佈的參數是其尺度參數。什麼意思呢?對於\(X\sim E(\lambda)\),它的分佈函數是\(F(x)=1-e^{-\lambda x}\),對其做伸縮變換\(aX\),有
對比\(F(x)\)的形式,發現\(aX\sim E(\lambda /a)\),這就表明伸縮變換不改變指數分佈的性質,因此說指數分佈的參數是其尺度參數。既然\(\Gamma\)分佈是指數分佈的直接推廣,則\(\Gamma\)分佈也具備這樣的性質:若\(X\sim \Gamma(n,\lambda)\),則
這樣的變換不改變數量參數\(n\),這也是指數分佈中獲得的直接推廣結論。
還記得正態分佈的衍生分佈——\(\chi^2(n)\)分佈嗎?以前,由於卡方分佈的密度函數過於複雜,很差記憶,因此咱們跳過了,但瞭解過\(\Gamma\)分佈的密度函數後再回看卡方分佈,就會有一種熟悉感。
對於\(X\sim \chi^2(n)\),其密度函數爲
能夠看到,它的核恰好是\(e^{-x}\)的某次方,乘以\(x\)的某次方形式,前面的正則化係數由核決定,所以,\(\chi^2(n)\)分佈本質上也是\(\Gamma\)分佈的一種特例,即
這樣,再記憶\(\chi^2(n)\)分佈的密度函數就會顯得容易一些了。另外,若是\(2n\)是整數,也能夠經過\(\Gamma\)分佈的伸縮變換將其變成卡方分佈:
最後,因爲咱們接下來要進入離散分佈的參數估計,在這裏也給出一個\(\Gamma\)分佈與泊松分佈的聯繫,這個聯繫在隨機過程當中會發揮必定的做用,其證實在數理統計中倒不是特別重要。
若\(N\)定義爲知足下列條件的\(n\)值:\(X_1,X_2,\cdots\stackrel{\mathrm{i.i.d.}}\sim E(\lambda)\),
則\(N\sim P(\lambda)\)。
下面給出這個定理的證實,其中的思想能夠學習。
設\(\sum_{j=1}^k X_j\)的密度函數爲\(p_k(x)\),則因爲\(\sum _{j=1}^k X_j\sim \Gamma(k,\lambda)\),因此
\[p_k(x)=\frac{\lambda^k}{\Gamma(n)}x^{k-1}e^{-\lambda x}. \]由全機率公式(連續形式),
\[\begin{aligned} &\quad \mathbb{P}(N=k)\\ &=\mathbb{P}\left(\sum_{j=1}^kX_i\le 1,\sum_{j=1}^{k+1}X_i>1 \right)\\ &=\int_0^1\mathbb{P}\left(\sum_{j=1}^{k+1} X_j>1\bigg|\sum_{j=1}^k X_i=x \right)p_k(x)\mathrm{d}x\\ &=\int_0^1\mathbb{P}(X_{k+1}>1-x)p_k(x)\mathbb{d}x\\ &=\int_0^1e^{-\lambda {(1-x)}}\frac{\lambda^k}{(k-1)!}x^{k-1}e^{-\lambda x}\mathrm{d}x\\ &=\frac{\lambda^k e^{-\lambda}}{(k-1)!}\int_0^1 x^{k-1}\mathrm{d}x\\ &=\frac{\lambda^k}{k!}e^{-\lambda}. \end{aligned} \]這是泊松分佈的分佈列,故\(N\sim P(\lambda)\)。
在上面兩篇文章中,將連續分佈的點估計進行了詳細的討論,並引出了次序統計量的分佈,介紹了\(\Gamma\)分佈與\(\beta\)分佈。接下來,咱們將轉向離散型分佈的參數點估計,看看離散形式下因子分解定理應當如何使用。