泊松分佈與美國槍擊案

去年12月,美國康涅狄格州發生校園槍擊案,形成28人死亡。事件

資料顯示,1982年至2012年,美國共發生62起(大規模)槍擊案。其中,2012年發生了7起,是次數最多的一年。圖片

在此輸入圖片描述

去年有這麼多槍擊案,這是巧合,仍是代表美國治安惡化了?io

前幾天,我看到一篇頗有趣的文章,使用"泊松分佈"(Poisson distribution),判斷同一年發生7起槍擊案是否巧合。test

讓咱們先經過一個例子,瞭解什麼是"泊松分佈"。變量

已知某家小雜貨店,平均每週售出2個水果罐頭。請問該店水果罐頭的最佳庫存量是多少? 假定不存在季節因素,能夠近似認爲,這個問題知足如下三個條件: (1)顧客購買水果罐頭是小几率事件。 (2)購買水果罐頭的顧客是獨立的,不會互相影響。 (3)顧客購買水果罐頭的機率是穩定的。 在統計學上,只要某類事件知足上面三個條件,它就服從"泊松分佈"。 泊松分佈的公式以下:sso

在此輸入圖片描述

各個參數的含義:   P:每週銷售k個罐頭的機率。   X:水果罐頭的銷售變量。   k:X的取值(0,1,2,3...)。   λ:每週水果罐頭的平均銷售量,是一個常數,本題爲2。im

根據公式,計算獲得每週銷量的分佈:統計

在此輸入圖片描述

從上表可見,若是存貨4個罐頭,95%的機率不會缺貨(平均每19周發生一次);若是存貨5個罐頭,98%的機率不會缺貨(平均59周發生一次)。img

如今,咱們再回過頭,來看美國槍擊案。di

假定它們知足"泊松分佈"的三個條件:

  (1)槍擊案是小几率事件。

  (2)槍擊案是獨立的,不會互相影響。

  (3)槍擊案的發生機率是穩定的。

顯然,第三個條件是關鍵。若是成立,就說明美國的治安沒有惡化;若是不成立,就說明槍擊案的發生機率不穩定,正在提升,美國治安惡化。

根據資料,1982--2012年槍擊案的分佈狀況以下:

在此輸入圖片描述

計算獲得,平均每一年發生2起槍擊案,因此 λ = 2 。

在此輸入圖片描述

上圖中,藍色的條形柱是實際的觀察值,紅色的虛線是理論的預期值。能夠看到,觀察值與指望值仍是至關接近的。

咱們用"卡方檢驗"(chi-square test),檢驗觀察值與指望值之間是否存在顯著差別。

  卡方統計量 = Σ [ ( 觀察值 - 指望值 ) ^ 2 / 指望值 ]

計算獲得,卡方統計量等於9.82。查表後獲得,置信水平0.90、自由度7的卡方分佈臨界值爲12.017。所以,卡方統計量小於臨界值,這代表槍擊案的觀察值與指望值之間沒有顯著差別。因此,能夠接受"發生槍擊案的機率是穩定的"假設,也就是說,從統計學上沒法獲得美國治安正在惡化的結論。

可是,也必須看到,卡方統計量9.82離臨界值很接近,p-value只有0.18。也就是說,對於"美國治安沒有惡化"的結論,咱們只有82%的把握,還有18%的多是咱們錯了,美國治安實際上正在惡化。所以,這就須要看從此兩年中,是否還有大量槍擊案發生。若是確實發生了,泊松分佈就不成立了。

相關文章
相關標籤/搜索