抽樣於二項分佈的數據的指望方差是 = nπ(1-π),n爲觀測數,n爲屬於 Y=1組的機率。所謂 過分離勢, 即觀測到的響應變量的方差大於指望的二項分佈的方差。過分離勢會致使奇異的標準誤檢驗和不精確的顯著性檢驗函數
一、比較二項分佈模型的殘差誤差與殘差自由度,若是比值:code
= 殘差誤差/殘差自由度對象
比 1 大不少,即可以認爲存在過分離勢it
#斷定過分離勢,仍是利用以前Affairs的例子 > deviance(fit.reduced)/df.residual(fit.reduced) [1] 1.03248 #結果很是接近1,代表沒有過分離勢
二、對過分離勢進行檢驗io
須要擬合模型兩次,第一次使用 family =binomial,第二次使用 family =「quasibinomial」,假設第一次glm()返回對象記爲fit,第二次返回對象記爲 fit.od,那麼:變量
pchisq(summary(fit.od)$dispersion*fit$df.residual,fit$df.residual,lower =F)
提供的p值便可對零假設 H0: = 1 與備擇假設 ,H1:
≠ 1 進行檢驗。若 p 很小(小於0.05),即可以拒絕零假設方法
#Affairs例子 > fit <- glm(ynaffair ~ age + yearsmarried + religiousness + + rating, family = binomial(), data = Affairs) > fit.od <- glm(ynaffair ~ age + yearsmarried + religiousness + + rating, family = quasibinomial(), data = Affairs) > pchisq(summary(fit.od)$dispersion * fit$df.residual, + fit$df.residual, lower = F) [1] 0.340122 #顯然不顯著
當出現過分離勢時,仍可以使用glm()函數擬合Logistic迴歸,但此時須要將二項分佈改成類二項分佈(quasibinomial distribution)im