過分離勢

  • 概念

抽樣於二項分佈的數據的指望方差是  = nπ(1-π),n爲觀測數,n爲屬於 Y=1組的機率。所謂 過分離勢, 即觀測到的響應變量的方差大於指望的二項分佈的方差過分離勢會致使奇異的標準誤檢驗和不精確的顯著性檢驗函數

  • 檢測方法

一、比較二項分佈模型的殘差誤差與殘差自由度,若是比值:code

      = 殘差誤差/殘差自由度對象

比 1 大不少,即可以認爲存在過分離勢it

#斷定過分離勢,仍是利用以前Affairs的例子
> deviance(fit.reduced)/df.residual(fit.reduced)
[1] 1.03248 #結果很是接近1,代表沒有過分離勢

 

二、對過分離勢進行檢驗io

須要擬合模型兩次,第一次使用 family =binomial,第二次使用 family =「quasibinomial」,假設第一次glm()返回對象記爲fit,第二次返回對象記爲 fit.od,那麼:變量

pchisq(summary(fit.od)$dispersion*fit$df.residual,fit$df.residual,lower =F)

提供的p值便可對零假設 H0:  = 1 與備擇假設 ,H1:   ≠ 1 進行檢驗。若 p 很小(小於0.05),即可以拒絕零假設方法

#Affairs例子
> fit <- glm(ynaffair ~ age + yearsmarried + religiousness +
+              rating, family = binomial(), data = Affairs)
> fit.od <- glm(ynaffair ~ age + yearsmarried + religiousness +
+                 rating, family = quasibinomial(), data = Affairs)
> pchisq(summary(fit.od)$dispersion * fit$df.residual,  
+        fit$df.residual, lower = F)
[1] 0.340122   #顯然不顯著

 

  • 過分離勢的處理

當出現過分離勢時,仍可以使用glm()函數擬合Logistic迴歸,但此時須要將二項分佈改成類二項分佈(quasibinomial distribution)im

相關文章
相關標籤/搜索