是時候解決 students's Test 假設檢驗(顯著性檢驗)了

T test 由來已久

from scipy import stats
import numpy as np
  • 假設檢驗也叫顯著性檢驗,是以小几率反證法的邏輯推理,判斷假設是否成立的統計方法。
  • 首先,假設樣本對應的整體參數(或分佈)與某個一直整體參數(或分佈)相同,而後根據統計量的分佈規律來分析樣本數據,利用樣本信息判斷是否支持這種假設,並對檢驗假設作出抉擇,作出的結論是機率性的,不是絕對的確定或者否認
  • 簡書原文連接

T 檢驗的概念

  • T檢驗是用於兩個樣本(或樣本與羣體)平均值差別度的檢驗方法。
  • 利用T分佈理論來推斷差別發生的機率,從而判斷兩個平均數的差別是否顯著python

  • T 檢驗的適用條件爲樣本分佈符合正態分佈
    • 適用條件
      • 當樣本例數較小時,要求樣本取自正態整體
      • 作兩樣本均值比較時,還要去兩樣本的整體方差相等
    • 用途
      • 樣本均數與羣體均數的比較
      • 兩樣本均數的比較

假設檢驗的步驟

假設檢驗能夠分爲三步:

  • 創建建設檢驗的假設和肯定檢驗水準
  • 選定檢驗防範和計算檢驗統計量
  • 肯定P值和作出推斷結論

創建檢驗假設和肯定檢驗水準

假設檢驗 是針對整體特徵而言的,包括相互對立的兩個方面,即兩種假設,一週用是無效假設或者原假設、零假設,符號爲H0,它是要否認的假設,另外一種是備選假設,記爲H1,它是H0 的對立面。兩者是從反正法的思想提出的,H1和H0的相互關係,又相互對立的假設
假設檢驗還須要根據研究目的的事件設置是否拒絕原假設的標準即,檢驗水準也叫顯著性水準。它指的是原假設爲真,可是被錯誤的拒絕的一個小几率值,通常去檢驗水準爲α=0.05設計

單側檢驗與雙側檢驗

  • 在進行t檢驗的時候,若是其目的在於檢驗這個整體均數是否相等,即爲雙側檢驗
    例如,在檢驗某種新的降壓藥與經常使用降壓藥的效力是否相同,就是說,新葯效力可能比舊藥好,也可能比舊藥查,或者相同,都有可能,此時則須要進行雙側檢驗code

  • 若是咱們已經新葯的效力不可能低於舊藥的效力,例如磺胺藥+磺胺藥增效劑從理論上推知其效果不可能低於單用磺胺藥,這時,原假設設定爲H0: μ1=μ2,備選假設爲H1:μ1>μ2 ,統計上成爲單側檢驗blog

選定檢驗方法和計算檢驗統計量

  • 根據研究設計的類型和統計推斷的目的選用不一樣的檢驗方法,如成組設計的兩樣本均數的比較用t 檢驗,多個樣本均數的比較用F檢驗事件

  • 檢驗統計量適用於抉擇是否拒絕H0 的統計量,所以在咱們肯定檢驗假設H0,H1時,檢驗方法的和檢驗統計量就已經肯定了,其統計分佈在統計推斷中相當重要,不一樣的檢驗方法要用不一樣的方式計算現有樣本的檢驗統計量ip

肯定P值和作出推斷結論

  • 這裏的P值是指由H0成立時的檢驗統計量出如今用本計算出來的統計量的末端或者更末端處的機率值
  • 當P<=α時,結論按照索取檢驗水準H0,即認爲二者的均值有顯著性差別,而H0設定爲二者相等,推翻H0,接受H1。(按照P值的定義,在H0成立的條件下,出現等於及大於現有檢驗統計量值的機率)The P-value is the probability of obtaining a result at least as extreme as the one that was actually observed, given that the null hypothesis is true.若是是檢驗問題,p值反映的是樣本數據支持原假設的證據,p值越大,證據越強。若是P<α,則認爲樣本數據不能支持原假設,進而接受H1,即兩個均值存在顯著性差別,不相等
  • 若是P>α,樣本數據更支持H0,對於H0發生的機率也就越大,從而兩個均值沒有顯著性差別,接受H0。

假設檢驗的兩類錯誤

  • I型錯誤,第一類錯誤,假陽性錯誤,就是在作假設檢驗作推斷結論時,拒絕了實際上正確的原假設H0,其機率用α表示(拒絕正確),推斷正確的可能性爲1-α,也就是置信度
  • II型錯誤,第二類錯誤,假陰性錯誤,原假設爲不正確的,可是獲得的統計量不足以拒接H0,錯誤的得出的無差異的結論(接受錯誤)

相關文章
相關標籤/搜索