如何計算假設檢驗的功效(power)和效應量(effect size)?

作完一個假設檢驗以後,若是結果具備統計顯著性,那麼還須要繼續計算其效應量,若是結果不具備統計顯著性,而且還須要繼續進行決策的話,那麼須要計算功效。css

 

功效(power):正確拒絕原假設的機率,記做1-β。html

假設檢驗的功效受如下三個因素影響:ide

  • 樣本量 (n):其餘條件保持不變,樣本量越大,功效就越大。
  • 顯著性水平 (α): 其餘條件保持不變,顯著性水平越低,功效就越小。
  • 兩整體之間的差別:其餘條件保持不變,整體參數的真實值和估計值之間的差別越大,功效就越大。也能夠說,效應量(effect size)越大,功效就越大。

 

應用:根據顯著性水平α,效應量和樣本容量n,計算功效。post

(可用G*Power或Statsmodels計算)spa

單樣本t檢驗:statsmodels.stats.power.tt_solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonealternative='two-sided')3d

獨立樣本t檢驗:statsmodels.stats.power.tt_ind_solve_power(effect_size=Nonenobs1=Nonealpha=Nonepower=Noneratio=1.0alternative='two-sided')code

卡方檢驗:statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonen_bins=2)htm

F檢驗:statsmodels.stats.power.FTestPower.solve_power(effect_size=Nonedf_num=Nonedf_denom=Nonenobs=Nonealpha=Nonepower=Nonencc=1)blog

方差分析:statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonek_groups=2)ci

 

效應量(effect size): 樣本間差別或相關程度的量化指標。

效應量一般用三種方式來衡量:(1) 標準均差(standardized mean difference),(2) 概率(odd ratio),(3) 相關係數(correlation coefficient)。

 

這裏說一下第一種:標準均差(standardized mean difference)。主要有如下幾種指標:

 

Cohen’s : 兩整體均值之間的標準差別。適用於兩組樣本的樣本量和方差類似的狀況。

計算公式:cohen's d effect size

其中:cohen's d calculation

 

 

Hedges’ g是cohen的方法的改進,適用於兩組樣本的樣本量不一樣的狀況。

計算公式:hedges' g method of effect size

其中:standard deviation

 

Glass’s Δ (delta)和cohen的方法相似,可是隻除以控制組的標準差。適用於兩組樣本的方差不一樣的狀況。

計算公式:glass' A method of effect size

 

Cramer’s φ (Phi) or Cramer’s V用於測算類別型數據的效應量。當類別型變量包含2個類別時,使用Cramer’s phi,若是超過2個類別,那麼使用Cramer’s V。

 

Cohen’s f2: 用於測算方差分析,多元迴歸之類的效應量。

計算公式:cohen's f2 method of effect size

 

應用:根據顯著性水平α,功效和樣本容量n,計算效應量。

(可用G*Power或Statsmodels計算)

單樣本t檢驗:statsmodels.stats.power.tt_solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonealternative='two-sided')

獨立樣本t檢驗:statsmodels.stats.power.tt_ind_solve_power(effect_size=Nonenobs1=Nonealpha=Nonepower=Noneratio=1.0alternative='two-sided')

卡方檢驗:statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonen_bins=2)

F方差齊性檢驗:statsmodels.stats.power.FTestPower.solve_power(effect_size=Nonedf_num=Nonedf_denom=Nonenobs=Nonealpha=Nonepower=Nonencc=1)

方差分析:statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonek_groups=2)

 

以上兩種應用都屬於過後檢驗(post hoc)。除此以外,還有一個應用就是:根據顯著性水平α,功效和效應量,計算樣本容量n。這屬於事前檢驗(prior)。具體請見:《如何肯定假設檢驗的樣本量?》

 

參考:

https://wenku.baidu.com/view/d78a82ecb9d528ea80c7792c.html

https://www.statisticssolutions.com/statistical-analyses-effect-size/

相關文章
相關標籤/搜索