機率統計14——幾何分佈

  我家小朋友年方1歲半,家裏天天上午都要出去遛小孩。如今小朋友有兩項愛好,在家翻垃圾桶,出門撿菸頭。 python

  翻垃圾桶能夠有效地限制,撿菸頭但是防不勝防。微信

  也許菸頭能散發出特殊的能量波動,小區的綠化帶和草坪上的大部分菸頭都能被小朋友準確地發現,若是他在不規則的前進路線中忽然停下了,那確定是看到了新的菸頭。函數

錯失獎勵機率

  在個人嚴密監視下,小朋友撿菸頭的概率已經從原來的「毫不放過」降低到了如今的20%,若是他直到回家尚未菸頭,就能獲得一個棒棒糖做爲獎勵。固然,每一個菸頭對他來講仍然存在着獨特的魅力,在最初遇到的3個菸頭中沒有經受住考驗的機率是多少?學習

  設隨機變量X是小朋友最終撿起菸頭時所發現的菸頭個數,那麼:spa

  最初遇到的3個菸頭中沒有抵抗住誘惑的機率能夠用P(X ≤ 3)表示:code

  每一個菸頭都是一次考驗,個人關注點是,小朋友在第幾回考驗時會撿起菸頭?orm

質量函數

  小朋友每次遇到菸頭的行爲都是一個獨立的隨機試驗,試驗只有成功和失敗兩種結果,且對於每一個隨機試驗來講,成功的機率都是相同的。對於小朋友本身來講,撿起菸頭是成功,錯過纔是失敗,只要成功一次就沒有棒棒糖,試驗結束。如今用p表示成功率(撿起菸頭的機率),q = 1 – p表示失敗率,隨機變量X表示第一次成功時所經歷的試驗次數,那麼在進行了r次試驗後才遇到第一次成功的機率(或者說在第r次試驗取得成功前,須要經歷r-1次失敗的機率)能夠表示爲:blog

  這個分佈就是幾何分佈(Geometric distribution),X服從幾何分佈,記爲X~GE(p)。ip

  下面的python代碼展現了r取不一樣值時的P(X=r)。ci

 1 import numpy as np
 2 import matplotlib.pyplot as plt
 3 from scipy import stats
 4
 5 p = 0.2 # 成功率
 6 print('X ~ GE({0})'.format(p))
 7
 8 rs = np.array(range(1, 11, 1)) # 隨機變量的取值
 9 # 幾何分佈 X ~ GE(0.2)
10 ps = stats.geom.pmf(rs, p) # 每一個隨機變量對應的機率
11 for i, r in enumerate(rs):
12     print('P(X={0})={1}'.format(r, ps[i]))
13
14 plt.bar(left=rs, height=ps, width=0.5)
15 plt.xlabel('r, X=r表示第r次試驗才成功')
16 plt.ylabel('P(X=r)')
17 plt.rcParams['font.sans-serif'] = ['SimHei']  # 用來正常顯示中文標籤
18 plt.show()

  X ~ GE(0.2)

  P(X=1)=0.2

  P(X=2)=0.16000000000000003

  P(X=3)=0.12800000000000003

  P(X=4)=0.10240000000000003

  P(X=5)=0.08192000000000002

  P(X=6)=0.06553600000000002

  P(X=7)=0.052428800000000025

  P(X=8)=0.041943040000000015

  P(X=9)=0.033554432000000016

  P(X=10)=0.026843545600000015

  對於幾何分佈來講,r是大於等於1的天然數,而且只有成功的機率處於(0, 1)之間纔有意義,所以當r = 1時,P(X = r)達到最大值,隨着r的增大,P(X = r)也愈來愈小。

  幾何分佈是一個典型的長尾分佈,第一次就成功的機率是最高的,這看似有違直覺。這裏須要注意的是,「第r次才取得成功」和「在r次以內取得成功」是兩回事,後者纔是機率愈來愈大。

  實際中有很多隨機變量服從幾何分佈,例如某產品的不合格率爲0.05,則首次查到不合格品的檢查次數X~GE(0.05)。

分佈的形狀

  如今回到問題的關注點:小朋友在第幾回考驗時會撿起菸頭?這個問題並不能確切地回答,能夠回答的是,在r次考驗以內撿起菸頭的機率。這個機率能夠用分佈函數表示:

  另外一種計算方法是:

  P(X > r)表示在取得第一次成功時,前r次試驗都失敗的機率。F(r)更爲專業的說法是:爲獲得1次成功而進行r次伯努利試驗,r的機率分佈。

  

  下面的代碼展現了幾何分佈的形狀:

1 fs = stats.geom.cdf(rs, p) # 每一個r對應的分佈
2 for i, r in enumerate(rs):
3     print('F({0})=P(X<={0})={1}'.format(r, fs[i]))
4
5 plt.bar(left=rs, height=fs, width=0.5)
6 plt.xlabel('r, X<=r表示前r次試驗至少有一次成功')
7 plt.ylabel('F(r) = P(X <= r)')
8 plt.rcParams['font.sans-serif'] = ['SimHei']  # 用來正常顯示中文標籤
9 plt.show()

  F(1)=P(X<=1)=0.19999999999999998)

  F(2)=P(X<=2)=0.36)

  F(3)=P(X<=3)=0.488)

  F(4)=P(X<=4)=0.5904)

  F(5)=P(X<=5)=0.67232)

  F(6)=P(X<=6)=0.7378560000000001)

  F(7)=P(X<=7)=0.7902848)

  F(8)=P(X<=8)=0.83222784)

  F(9)=P(X<=9)=0.865782272)

  F(10)=P(X<=10)=0.8926258176)

  小朋友大約有89%的機率在10次考驗內撿起菸頭,他也所以不多獲得棒棒糖。

指望和方差

  X ~ GE(p),q=1-p,P(X = r) = pqr-1,當r→∞時:

  來看看是怎麼得出的。

指望

  能夠根據幾何級數的公式繼續計算:

  對於幾何分佈來講,p=0.2表示單次試驗成功的機率是0.2,E[X]=1/p=5是在告訴咱們,指望在第5次試驗時得到成功,或者說5次試驗中就有一次趨向成功。

方差

  根據Var(X) = E[X2] – E[X]2來計算幾何分佈的方差:

  將①代入:


  出處:微信公衆號 "我是8位的"

  本文以學習、研究和分享爲主,如需轉載,請聯繫本人,標明做者和出處,非商業用途! 

  掃描二維碼關注做者公衆號「我是8位的」

相關文章
相關標籤/搜索