泊松迴歸

  • 泊松迴歸介紹
泊松迴歸適用於在給定時間內響應變量爲事件發生數目的狀況,它假設 Y 服從泊松分佈,線性模型的擬合形式爲
其中   是 Y 的均值(也等於方差)。此時,鏈接函數爲 ,機率分佈爲泊松分佈,擬合泊松迴歸模型以下
glm(Y ~ X1 + X2 + X3, family=poisson(link="log"),data=mydata)

使用robust包中的breslow(癲癇數據)數據
響應變量爲sumy(隨機化後八週內癲癇發病數),預測變量爲治療條件(Trt)、年齡(Age)、前八週的基礎癲癇發病數(Base)
觀看基礎的癲癇發病數和年齡,對響應變量的潛在影響,最後看下藥物治療可否減小癲癇的發病數
> data(breslow.dat,package = "robust") #導入robust包中的breslow數據
> names(breslow.dat)                   #變量名稱
 [1] "ID"    "Y1"    "Y2"    "Y3"    "Y4"    "Base"  "Age"   "Trt"   "Ysum"  "sumY"  "Age10"
[12] "Base4"
> summary(breslow.dat[c(6,7,8,10)]) #得到六、七、八、10的變量數據等同於 breslow.dat[,c(6,7,8,10)]
      Base             Age               Trt          sumY       
 Min.   :  6.00   Min.   :18.00   placebo  :28   Min.   :  0.00  
 1st Qu.: 12.00   1st Qu.:23.00   progabide:31   1st Qu.: 11.50  
 Median : 22.00   Median :28.00                  Median : 16.00  
 Mean   : 31.22   Mean   :28.34                  Mean   : 33.05  
 3rd Qu.: 41.00   3rd Qu.:32.00                  3rd Qu.: 36.00  
 Max.   :151.00   Max.   :42.00                  Max.   :302.00  

#繪製圖形觀察基本的狀況
> opar <- par(no.readonly = TRUE)  #複製一份圖形設置
> par(mfrow = c(1,2))              #修改參數
> attach(breslow.dat)

> hist(sumY,breaks = 20,xlab="Seizure Count",
+      main="Distribution of Seizure")
> boxplot(sumY~Trt,xlab ="Treatment",main="Group Comparisons")
> par(opar)                        #還原原來的設置
因變量的偏倚特性以及可能的離羣點,初看圖形時,藥物治療下癲癇發病數彷佛變小,且方差也變小了(泊松分佈中,較小的方差伴隨着較小的均值)。 與標準最小二乘法迴歸不一樣,泊松迴歸並不關注方差別質性
#擬合泊松迴歸
> fit <- glm(sumY ~ Base + Age + Trt, data=breslow.dat, family=poisson())  # family = poisson()
> summary(fit)

Call:
glm(formula = sumY ~ Base + Age + Trt, family = poisson(), data = breslow.dat)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-6.0569  -2.0433  -0.9397   0.7929  11.0061  

Coefficients:
               Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.9488259  0.1356191  14.370  < 2e-16 ***
Base          0.0226517  0.0005093  44.476  < 2e-16 ***
Age           0.0227401  0.0040240   5.651 1.59e-08 ***
Trtprogabide -0.1527009  0.0478051  -3.194   0.0014 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 2122.73  on 58  degrees of freedom
Residual deviance:  559.44  on 55  degrees of freedom
AIC: 850.71

Number of Fisher Scoring iterations: 5
發現 age,base,Trtprogabide都是顯著的,須要進行過分離勢檢測
相關文章
相關標籤/搜索