假設檢驗

1.假設檢驗的基本思想html

假設檢驗:測試

  • 什麼是假設:對整體參數(均值,比例等)的具體數值所做的陳述。好比,我認爲新的配方的藥效要比原來的更好。
  • 什麼是假設檢驗:先對整體的參數提出某種假設,而後利用樣本的信息判斷假設是否成立的過程。好比,上面的假設我是要接受仍是拒絕呢。


假設檢驗的應用:spa

  • 推廣新的教育方案後,教學效果是否有所提升
  • 醉駕斷定爲刑事犯罪後是否會使得交通事故減小
  • 男生和女生在選文理科時是否存在性別因素影響

 

假設檢驗的基本思想:設計

 

顯著性水平:3d

  • 一個機率值,原假設爲真時,拒絕原假設的機率,表示爲alpha,經常使用取值爲0.01,0.05,0.10
  • 一個公司要來招聘了,原本實際有200我的準備混一混,可是公司但願只有5%的人是渾水摸魚進來的,因此可能會有200*0.05=4我的混進來,所謂顯著性水平α,就是你容許最多有多大比例渾水摸魚的經過你的測試。

 

假設檢驗的步驟:htm

  • 提出假設
  • 肯定適當的檢驗統計量
  • 規定顯著性水平
  • 計算檢驗統計量的值
  • 作出統計決策

 

2.左右檢驗與雙側檢驗對象

原假設與備擇建設:blog

  • 待檢驗的假設又叫原假設,也能夠叫零假設,表示爲H0。(零假設其實就是表示原假設通常都是說沒有差別,沒有改變。。。)
  • 與原假設對比的假設叫作備擇假設,表示爲H1
  • 通常在比較的時候,主要有等於,大於,小於

 

檢驗統計量:事件

  • 計算檢驗的統計量
  • 根據給定的顯著性水平,查表得出相應的臨界值
  • 將檢驗統計量的值與顯著性水平的臨界值進行比較
  • 得出拒絕或不拒絕原假設的結論


檢驗中常說的小几率:ci

  • 在一次試驗中,一個幾乎不可能發生的事件發生的機率
  • 在一次試驗中小几率事件一旦發生,咱們就有理由拒絕原假設
  • 小几率由咱們事先肯定

 

檢驗中常說的小几率:

  • 在一次試驗中,一個幾乎不可能發生的事件發生的機率
  • 在一次試驗中小几率事件一旦發生,咱們就有理由拒絕原假設
  • 小几率由咱們事先肯定

 

P值:

  • 是一個機率值
  • 若是原假設爲真,P-值是抽樣分佈中大於或小於樣本統計量的機率
  • 左側檢驗時,P-值爲曲線下方小於等於檢驗統計量部分的面積
  • 右側檢驗時,P-值爲曲線下方大於等於檢驗統計量部分的面積


左側檢驗與右側檢驗

  • 當關鍵詞有不得少於/低於的時候用左側,好比燈泡的使用壽命不得少於/低於700小時時
  • 當關鍵詞有不得多於/高於的時候用右側,好比次品率不得多於/高於5%時

 

  • 當左側檢驗時,樣本統計量小於臨界值(位於臨界值左邊,臨界值的大小由查表得出),則拒絕原假設,不然接受原假設
  • 當右側檢驗時,樣本統計量大於臨界值(位於臨界值右邊,臨界值的大小由查表得出),則拒絕原假設,不然接受原假設

 

雙側檢驗

  • 單側檢驗指按分佈的一側計算顯著性水平機率的檢驗。用於檢驗大於、小於、高於、低於、優於、劣於等有肯定性大小關係的假設檢驗問題。這類問題的肯定是有必定的理論依據的。假設檢驗寫做:u1<u2或u1>u2。
  • 雙側檢驗指按分佈兩端計算顯著性水平機率的檢驗,應用於理論上不能肯定兩個整體一個必定比另外一個大或小的假設檢驗。通常假設檢驗寫做H1:u1≠u2。

例如,某種零件的尺寸,要求其平均長度爲10cm,大於或小於10cm均屬於不合格,咱們想要證實(檢驗)大於或小於這兩種可能性中的任何一種是否成立,創建的原假設與備擇假設應爲:
  H0:u=10    H1:u≠10

 

檢驗結果:

  單側檢驗

  • 若p值>a,不拒絕H0
  • 若p值<a,拒絕H0

  雙側檢驗:

  • 若p值>a/2,不拒絕H0
  • 若p值<a/2,拒絕H0

 

3.Z檢驗基本原理

整體均值檢驗

  • 注意:通常狀況下都用t檢驗,能用z檢驗的均可以用t檢驗,能用t檢驗的不必定能用z檢驗。

 

統計量Z值的計算公式爲:
若是檢驗一個樣本平均數與一個己知的整體平均數的差別是否顯著,其z值計算公式爲:

若是檢驗來自兩個的兩組樣本平均數的差別性,從而判斷它們各自表明的整體的差別是否顯著,其Z值計算公式爲:

Z檢驗原理:

  • 當整體標準差已知,樣本量較大時用標準正態分佈的理論來推斷差別發生的機率,從而比較兩個平均數的差別是否顯著
  • 標準正態變換後Z的界值

雙側:

單側:

 

4.Z檢驗實例

Z檢驗實例1:
研究正常人與高血壓患者膽固醇含量(mg%)的資料以下,試比較兩組血清膽固醇含量有無差異。

正常人組:

高血壓組:

創建檢驗假設,肯定檢驗水平

計算統計量Z值
  >將已知數據代入公式,得

肯定P值,做出推斷結論:本例Z=10.40>1.96(本例符合雙側檢驗,查表得1 - α/2 = 0.975對應值),故P<0.05,按α=0.05水準拒絕H0,接受H1,能夠認爲正常人與高血壓患者的血清膽固醇含量有差異,高血壓患者高於正常人。

 

Z檢驗實例2:
某機牀廠加工一種零件,根據經驗知道,該廠加工零件的橢圓度近似服從正態分佈,其整體均值爲u=0.081mm,整體標準差爲δ=0.025。今換一種新機牀進行加工,抽取n=200個零件進行檢驗,獲得的橢圓度爲0.076mm。試問新機牀加工零件的橢圓度的均值與之前有無顯著差別?(α=0.05)  本例符合雙側檢驗。

 

Z檢驗實例3:
根據過去大量資料,某廠生產的燈泡的使用壽命服從正態分佈N~(1020,100/2)。現從最近生產的一批產品中隨機抽取16只,測得樣本平均壽命爲1080小時。試在0.05的顯著性水平下判斷這批產品的使用壽命是否有顯著提升?(α=0.05)

 

5.T檢驗基本原理

 

T檢驗:
根據研究設計,t檢驗有三種形式:

  • 單個樣本的t檢驗:

  用來比較一組數據的平均值和一個數值有無差別。例如,你選取了5我的,測定了他們的身高,要看這五我的的身高平均值是否高於、低於仍是等於1.70m,就須要用這個檢驗方法。

  • 配對樣本均數t檢驗(非獨立兩樣本均數檢驗)

  用來看一組樣本在處理先後的平均值有無差別。好比,你選取了5我的,分別在飯前和飯後測量了他們的體重,想檢測吃飯對他們的體重有無影響,就須要用這個t檢驗。

  • 兩個獨立樣本均數檢驗

  用來看兩組數據的平均值有無差別。好比,你選取了5男5女,想看男女之間身高有無差別,這樣,男的一組,女的一組,這兩個組之間的身高平均值的大小比較可用這種方法。

 

單個樣本t檢驗

  • 又稱單樣本均數t檢驗(one sample ttest),適用於樣本均數與已知整體均數u0的比較,目的是檢驗樣本均數所表明的整體均數是否與已知整體均數u0有差異。
  • 已知整體均數u0通常爲標準值、理論值或經大量觀察獲得的較穩定的指標值。
  • 應用條件,整體標準α未知的小樣本資料,且服從正態分佈。

 

實例:

  以往經過大規模調查已知某地新生兒出生體重爲3.30kg。從該地難產兒中隨機抽取35名新生兒,平均出生體重爲3.42kg,標準差爲0.40kg,問該地難產兒出生體重是否與通常新生兒體重不一樣?(臨界值表:http://www.docin.com/p-1173562569.html)

 

  • 創建檢驗假設,肯定檢驗水準
  • 計算檢驗統計量

本例自由度v=n-1=35-1=34,查表得得t0.05/2, 34=2.032。由於t<t0.05/2,34,故P>0.05,按α=0.05水準,不拒絕H0,差異無統計學意義,尚不能認爲該地難產兒與通常新生兒平均出生體重不一樣。

 

 

配對樣本均數t檢驗:

  • 簡稱配對t檢驗(paired ttest),又稱非獨立樣本均數檢驗,適用於配對設計計量資料均數的比較。
  • 配對設計(paired design)是將受試對象按某些特徵相近的原則配成對子,每對中的兩個個體隨機地給予兩種處理。

 

配對樣本均數t檢驗原理:

  • 配對設計的資料具備對子內數據一一對應的特徵,研究者應關心是對子的效應差值而不是各自的效應值。
  • 進行配對t檢驗時,首選應計算各對數據間的差值d,將d做爲變量計算均數。
  • 配對樣本t檢驗的基本原理是假設兩種處理的效應相同,理論上差值d的整體均數ud爲0,現有的不等於0差值樣本均數能夠來自ud=0的整體,也能夠來自u≠ 0的整體。
  • 可將該檢驗理解爲差值樣本均數與已知整體均數ud(ud=0)比較的單樣本t檢驗,其檢驗統計量爲:

 

實例:

有12名接種卡介苗的兒童,8周後用兩批不一樣的結核菌素,一批是標準結核菌素,一批是新制結核菌素,分別注射在兒童的前臂,兩種結核菌素的皮膚浸潤反應平均直徑(mm)如表所示,問兩種結核菌素的反應性有無差異。

 

 

6.T檢驗實例

7.T檢驗應用條件

8.卡方檢驗

 

9.假設檢驗中的兩類錯誤
10.Python假設檢驗實例
11.Python卡方檢驗實例

相關文章
相關標籤/搜索