假設檢驗背後的邏輯

內容轉自知乎相關問題答案,寫的很清晰。react

1. 概述邏輯:測試

全稱命題只能被否證而不能被證實。這個道理很簡單,個案固然不足以證實一個全稱命題,可是卻能夠否認全稱命題。spa

研究時,咱們固然不但願否證本身的研究假設,因此咱們就搞個和研究假設相反的虛無假設。若是咱們否證了虛無假設,就至關於咱們證實了研究假設。因此假設檢驗就是要試圖否證虛無假設,或者說拒絕虛無假設。這是第一層道理。3d

第二層道理和抽樣分佈有關。因爲抽樣的緣由,樣本並不可能絕對地否證虛無假設。在個案中,小几率事件能夠等同於不可能發生的事件。咱們在這個意義上去在必定的事先約定的機率水平上去拒絕虛無假設。blog

做者:慕容飛宇
連接:https://www.zhihu.com/question/20254932/answer/14502093
來源:知乎
著做權歸做者全部。商業轉載請聯繫做者得到受權,非商業轉載請註明出處。
 
2. 具體解釋:
做者:王小明
連接:https://www.zhihu.com/question/20254932/answer/45583793
來源:知乎
著做權歸做者全部。商業轉載請聯繫做者得到受權,非商業轉載請註明出處。

我說我射擊特別厲害,平均能打到8環,那麼如何驗證我是否是在吹牛逼呢,那就讓我作幾回射擊看看我水平到底怎麼樣。

首先你選擇相信我,假設我沒吹牛,個人成績在8環附近(這就是原假設)。
我做爲一個8環水平的選手,射中的環數應該服從一個平均值爲8的高斯分佈。

可是事先說好個人原則:
一、可能我當天沒吃飽飯呀、或者心情很差呀,並且也就只讓我射擊幾回,我可能發揮很差等等的,因此你不能輕易懷疑我,若是我打7環、6環甚至4環你也不能懷疑我在吹牛
二、可是畢竟做爲一個8環水平的選手,基本功還應該是在的,若是我只打出了2環,你就會懷疑我是否是在吹牛了,請注意,做爲一個8環水平的選手,打出2環但是機率極低的事情

那麼根據這個規則咱們設置一個閾值好比3.6環(這個閾值就是臨界值),若是個人成績爲2環(個人成績是觀察值),那我就是在吹牛。注意做爲一個8環選手,打出小於這個閾值的機率是極低的(這個機率就是顯著性水平)。
還有一種判斷我是否是在吹牛的方法是,我已經打完了,計算打出小於我這個成績的機率(這個機率是p值),若是這個機率小於顯著性水平,則說明個人成績小於於臨界值,則說明我在吹牛;反之則我沒吹牛。(這個部分結合下面那個圖來理解)

用統計的說法就是:
一、不輕易拒絕原假設。原假設即便真的成立,而觀察的樣本因爲數量較少,觀察值存在必定的波動。因此咱們要給原假設必定範圍的容忍度,這個容忍度要儘量大,觀察值出如今這個範圍內都是能夠容忍的。

二、小几率事件發生不正常。若是小几率事件仍是發生了,那麼就說明原假設有問題。事件


結合這兩點,咱們設置一個隨機變量的區域,這個區域是偏離原假設的,而且發生在這個區域的機率很小,若是實際觀察到的值仍是出如今這個不太可能出現的範圍內,那麼咱們能夠拒絕原假設。ip


兩種決定是否接受原假設的方法:io

一、給定發生偏離原假設極端狀況的機率(這就是顯著性水平alpha),能夠計算獲得對應的臨界值(參照圖1,偏離原假設的陰影部分面積表示顯著性水平,對應的座標表示臨界值)。若觀察值在臨界值範圍內,表示出現這種現象都是比較正常的,則可接受原假設;若觀察值超出臨界值範圍,則表示在原假設條件下出現了不太可能的現象,那麼咱們就懷疑原假設的成立性,則拒絕原假設。class

二、給定發生偏離原假設極端狀況的機率。計算出現觀察值及比觀察值還要偏離原假設的機率(這就是p值)。(參照下面這個圖來理解)若p>alpha,則表示觀察值在臨界值範圍內,則可接受原假設(如圖1);若p<alpha,則表示觀察值在臨界值範圍以外,則拒絕原假設(如圖2)。p值是一我的工定義的東西,它其實仍是經過判斷觀察值是否在臨界值範圍內來決定是否接受原假設。變量

 


總結下:

對於一個假設,我不知道它是否成立,並且實際測試過程當中也存在許多非肯定性因素可能致使個人測試過程不許確,那麼我給出一個出現錯誤的容忍度(也就是顯著性水平alpha),根據這個容忍度能夠獲得相應臨界值(若觀察值在這個範圍內都是正常的,不然不正常),而後將觀察值和這個值比較。

可是有些狀況下觀察值不太好看出來,咱們能夠計算出發生觀察狀況以及更壞狀況的值(也就是p值)。若p值比alpha值大,則代表觀察值在臨界值範圍內,可接受原假設(如圖1);若p值比alpha值小,則代表觀察值在臨界值範圍外,則決絕原假設(如圖2)。

相關文章
相關標籤/搜索