作完一個假設檢驗以後,若是結果具備統計顯著性,那麼還須要繼續計算其效應量,若是結果不具備統計顯著性,而且還須要繼續進行決策的話,那麼須要計算功效。css
功效(power):正確拒絕原假設的機率,記做1-β。html
假設檢驗的功效受如下三個因素影響:ide
- 樣本量 (n):其餘條件保持不變,樣本量越大,功效就越大。
- 顯著性水平 (α): 其餘條件保持不變,顯著性水平越低,功效就越小。
- 兩整體之間的差別:其餘條件保持不變,整體參數的真實值和估計值之間的差別越大,功效就越大。也能夠說,效應量(effect size)越大,功效就越大。
應用:根據顯著性水平α,效應量和樣本容量n,計算功效。post
(可用G*Power或Statsmodels計算)spa
單樣本t檢驗:statsmodels.stats.power.
tt_solve_power
(effect_size=None, nobs=None, alpha=None, power=None, alternative='two-sided')3d
獨立樣本t檢驗:statsmodels.stats.power.
tt_ind_solve_power
(effect_size=None, nobs1=None, alpha=None, power=None, ratio=1.0, alternative='two-sided')code
卡方檢驗:statsmodels.stats.power.GofChisquarePower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, n_bins=2)htm
F檢驗:statsmodels.stats.power.FTestPower.
solve_power
(effect_size=None, df_num=None, df_denom=None, nobs=None, alpha=None, power=None, ncc=1)blog
方差分析:statsmodels.stats.power.FTestAnovaPower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, k_groups=2)ci
效應量(effect size): 樣本間差別或相關程度的量化指標。
效應量一般用三種方式來衡量:(1) 標準均差(standardized mean difference),(2) 概率(odd ratio),(3) 相關係數(correlation coefficient)。
這裏說一下第一種:標準均差(standardized mean difference)。主要有如下幾種指標:
Cohen’s d : 兩整體均值之間的標準差別。適用於兩組樣本的樣本量和方差類似的狀況。
計算公式:
其中:
Hedges’ g: 是cohen的方法的改進,適用於兩組樣本的樣本量不一樣的狀況。
計算公式:
其中:
Glass’s Δ (delta): 和cohen的方法相似,可是隻除以控制組的標準差。適用於兩組樣本的方差不一樣的狀況。
計算公式:
Cramer’s φ (Phi) or Cramer’s V: 用於測算類別型數據的效應量。當類別型變量包含2個類別時,使用Cramer’s phi,若是超過2個類別,那麼使用Cramer’s V。
Cohen’s f2: 用於測算方差分析,多元迴歸之類的效應量。
計算公式:
應用:根據顯著性水平α,功效和樣本容量n,計算效應量。
(可用G*Power或Statsmodels計算)
單樣本t檢驗:statsmodels.stats.power.
tt_solve_power
(effect_size=None, nobs=None, alpha=None, power=None, alternative='two-sided')
獨立樣本t檢驗:statsmodels.stats.power.
tt_ind_solve_power
(effect_size=None, nobs1=None, alpha=None, power=None, ratio=1.0, alternative='two-sided')
卡方檢驗:statsmodels.stats.power.GofChisquarePower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, n_bins=2)
F方差齊性檢驗:statsmodels.stats.power.FTestPower.
solve_power
(effect_size=None, df_num=None, df_denom=None, nobs=None, alpha=None, power=None, ncc=1)
方差分析:statsmodels.stats.power.FTestAnovaPower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, k_groups=2)
以上兩種應用都屬於過後檢驗(post hoc)。除此以外,還有一個應用就是:根據顯著性水平α,功效和效應量,計算樣本容量n。這屬於事前檢驗(prior)。具體請見:《如何肯定假設檢驗的樣本量?》。
參考:
https://wenku.baidu.com/view/d78a82ecb9d528ea80c7792c.html
https://www.statisticssolutions.com/statistical-analyses-effect-size/